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E noto che la matematica ha svolto fin dalla antichità un ruolo attivo e di 
produttivo sviluppo sul piano culturale nella vita sociale dell’uomo, basti per 
questo ricordare l’importanza avuta dalla scuola matematica greca con Pitago¬ 
ra, Euclide, Archimede il quale peraltro occupa un posto particolare nella matemati¬ 
ca per geniali scoperte da cui conseguirono importanti applicazioni. La matematica, 
che spesso, a torto, viene considerata come una scienza arida, noiosa, astratta, 
limitata e di dominio di una ristretta cerchia di cultori, è il permanente supporto di 
ogni scienza e di ogni attività pratica, concreta dell’uomo. Nel suo significato 
culturale, come pure nel suo uso ai fini applicativi, la matematica nelle sue varie 
estrinsecazioni e articolazioni ha legami con tutte le altre scienze, naturali e non, e 
queste sono legate alla matematica, che è il loro linguaggio e il loro strumento, spesso 
essenziale. Non è pertanto pensabile una separazione della matematica dal sostanziale 
sviluppo della vita sociale dell’uomo. Invero grandi conquiste, conseguite dall’uomo, 
in svariati importanti campi, sono basate proprio su notevoli risultati acquisiti facen¬ 
do uso di raffinati strumenti matematici. Il ruolo della matematica si è poi ampliato 
nell’ultimo secolo in relazione al notevole sviluppo industriale che si è accompagnato 
a conquiste sociali che hanno comportato l’uso sempre più spinto e avanzato di 
applicazioni della matematica in svariati campi, dalla ingegneria e dalla fisica alla 
biomedicina, dalla agricoltura allo studio dei fenomeni geodinamici e idrogeologici, 
dalla statistica alle scienze umane, alla sociologia, ecc., tanto che addirittura nell’ulti¬ 
mo ventennio ha preso corpo una sua branca specifica, l’informatica, che costituisce 
una disciplina attraverso la quale lo strumento matematico viene posto al servizio del¬ 
l’informazione nella sua più ampia accezione. In particolare è ben noto lo sviluppo 
acquisito negli ultimi anni dalla scienza dei calcolatori, che fonda le sue radici su stru¬ 
menti matematici. D’altra parte è anche da sottolineare l’importanza del ruolo cultu¬ 
rale della matemadca: non è accettabile infatti che questa scienza sia confinata nel 
ghetto delle discipline prettamente strumentali, assegnandole il livello di una tecnica, 
spesso anche molto raffinata, che non si può non diffondere perché è molto impor¬ 
tante per le applicazioni, ma che non ha nulla da dire sulla formazione dell’uomo. La 
matematica invece ha un suo posto insostituibile in questa formazione perché educa, 
attraverso il suo stretto rapporto con la logica, all’analisi critica dei concetti, 
all’astrazione, alla deduzione rigorosa e anche all’umiltà intellettuale. Sono i due 
profili culturali della matematica che vanno però riguardati globalmente, nel senso 
che attraverso una cultura matematica impostata sul rigore e l’astrazione è possibile 
pervenire a dare corrette interpretazioni e spiegazioni dei fenomeni naturali e creare 
così quegli strumenti applicativi occorrenti nella realtà quotidiana. A tale proposito 
va ricordato che spesso le più grandi scoperte hanno trovato conferma, spiegazione e 
sistemazione proprio attraverso lo studio matematico dei fenomeni a esse legati, e ne 
sono così derivate teorie che a loro volta hanno portato a nuove scoperte; basti per 
questo andare col pensiero all’astronomia e all’astronautica i cui risultati affondano 
le radici in notevoli teorie matematiche. D’altra parte spesso teorie matematiche 
create in maniera puramente astratta, a seguito di verifiche e riscontri, sono risultate 
essere la base concreta di rilevanti risultati pratici. È questo il caso dei profondi studi 
matematici in fluidodinamica che hanno portato poi a realizzazioni di alta tecnica, 
nonché alla soluzione del problema del superamento del muro del suono, determi¬ 
nando così una autentica rivoluzione nel campo aerospaziale. 

La rivista «Le Scienze» nella sua ampia concezione culturale non poteva non co¬ 
gliere l’importanza della diffusione delle conoscenze nel campo della matematica e 
pertanto sapientemente fin dalla sua nascita ha dato spazio ad argomenti matematici 
di alto livello culturale. Su un vasto piano internazionale, sono stati enucleati i temi 
di più vasto interesse corrente, presentando dei notevoli squarci di cultura matemati¬ 
ca, di grande validità. Proprio per le motivazioni esposte, gli articoli matematici di 
«Le Scienze» non potevano certamente rimanere esclusi dall’iniziativa di essere 
raccolti almeno in parte in un volume della serie delle «Letture», e in tale direzione si 
è giustamente mosso l’editore. 

La scelta è caduta su una serie di saggi che, nell’arco degli ultimi anni, riguardano 


PRESENTAZIONE 



gli aspetti principali dello sviluppo del pensiero matematico. Si tratta di una selezione 
che tocca le maggiori aree culturali e le fasi più salienti, mettendo in evidenza come le 
ricerche fondamentali e quelle più direttamente applicative siano strettamente intrec¬ 
ciate tanto da rendere spesso oltremodo incerto e opinabile il confine tra le une e le 
altre. A tale selezione è stato aggiunto un paio di interessanti articoli pubblicati 
sull’edizione originale americana. Gli articoli raccolti nel presente volume sono stati 
ripartiti in tre parti, riguardanti rispettivamente i fondamenti della matematica e la 
teoria degli insiemi, la matematica e la logica, la matematica nelle applicazioni. 

La prima parte si apre molto opportunamente con l’esposizione, tratta dalla 
rubrica «Giochi matematici», di M. Gardner, di una nuova e divertente variante dei 
noti paradossi di Zenone, dovuta ad A.K. Austin. Segue un articolo di W.V. Quine 
sui fondamenti della matematica. In esso, partendo da classici esempi, fonti di 
difficoltà concettuali, viene descritto il processo di riduzione di alcune nozioni a altre, 
e cioè il processo di riduzione dell’insieme dei concetti matematici con una risistema¬ 
zione generale che elimina le difficoltà originarie. Il discorso viene poi ampliato al 
caso delle leggi e alla teoria della dimostrazione, originata dagli studi di Godei. Segue 
poi un gruppo di tre articoli dedicati a questioni di teoria degli insiemi trattate con 
teorie non standard. P.J. Cohen e R. Hersh, servendosi di un’analogia con la 
geometria non euclidea, illustrano la non dimostrabilità (stabilita dallo stesso Cohen) 
dell’ipotesi del continuo formulata da Cantor alla fine del secolo scorso. L’articolo di 
M. Davis e R. Hersh è dedicato alla teoria dell’analisi non standard, un nuovo ramo 
della matematica di recente scoperto dal logico A. Robinson, che consente, utilizzan¬ 
do il linguaggio formale (peraltro legame fra logica e teoria dei calcolatori), di 
riportare in vita metodi infinitesimali nel calcolo differenziale e integrale, adoperati 
fin dall’antichità, ma spesso con dubbi. Nell’ordine di idee dell’adozione di teorie e 
tecniche non standard si inquadra l’articolo di G. Lolli sulla possibilità di costruzione 
di un nuovo modello del sistema dei numeri reali, particolarmente interessante per i 
suoi legami con la nozione di probabilità, e che è profondamente diverso da quello 
intuitivo costituito dalla retta euclidea. Un articolo di B. di Finetti è dedicato a una 
suggestiva e singolare illustrazione degli stretti legami che uniscono i tre numeri e, i, 
ti, fondamentali in matematica, con una descrizione che non richiede alcuna cono¬ 
scenza propedeutica, ma che proprio da se stessa fa scaturire le nozioni occorrenti, 
legandole anche a interessanti interpretazioni in fisica e in economia. 

I rapporti fra matematica e logica sono così intrinseci da costituirne una sola 
disciplina, talché si può ormai considerare la logica come fondamento essenziale della 
matematica. In proposito va sottolineato che l’astrattezza e la sistemazione rigorosa 
di taluni rami della matematica è resa possibile dalla presenza di tecniche logiche, 
che, proprio per il loro astratto rigore formale, conferiscono naturalezza e sicurezza 
al procedere di ragionamenti per la loro natura poco provvisti di supporto intuitivo, 
sicché sì può dire che la logica costituisce l’ossatura della matematica. La seconda 
parte degli articoli, che è dedicata a tali rapporti, si apre con una suggestiva e 
altamente divulgativa esposizione di M. Gardner di questioni di logica, riguardanti 
l’algebra di Boole, i diagrammi di Venn e il calcolo proposizionale. Segue un articolo 
di A. Tarski dedicato all’esame dei concetti di verità e di dimostrazione, diversi ma 
Ira loro connessi, e allo studio del problema della coincidenza o meno dell’insieme 
delle proposizioni formalmente dimostrabili con quello delle proposizioni vere. (Per 
la sua suggestività, il titolo dell’articolo è stato assunto come titolo del presente 
volume.) Il periodo di transizione dalla logica tradizionale a quella contemporanea, 
propugnata da B. Russell, costituì una tappa importante nella logica e W.W. Bartley 
III in un suo articolo mette in luce il fatto che esso ha avuto uno dei più interessanti 
innovatori tecnici in C.L. Dodgson (noto come L. Carroll). L’evoluzione della 
matematica è legata strettamente a quella dei processi nell’astrazione; in questo 
quadro acquista enorme rilevanza una recente conquista del pensiero matematico, la 
«teoria delle categorie» che, come è illustrato nell’articolo di L. Lombardo Radice, 
costituisce un nuovo livello di astrazione, collocandosi a un più elevato grado di 
generalità rispetto alle astrazioni di secondo grado che hanno caratterizzato la ma- 




tematica negli ultimi decenni del XIX secolo e nei primi del XX. Nel quadro del rap¬ 
porto fra logica e matematica si pongono i nessi fra la teoria della probabilità e la 
moderna logica induttiva, e nell’articolo di D. Costantini e M. Mondadori viene 
posto in luce come l’evoluzione del concetto di probabilità e la «crisi dei fondamenti» 
hanno legato strettamente tali teorie. Uno dei problemi che hanno occupato per secoli 
i ricercatori è stato quello della conferma di un’ipotesi scientifica mediante l’osserva¬ 
zione e l’esperimento: W.C. Salmon nel suo articolo pone in rilievo come la logica di 
questo procedimento è ancor lungi dall’essere compresa, poiché allo stadio attuale di 
sviluppo gli studi in proposito «hanno prodotto più paradossi ed enigmi che non 
soluzioni convincenti o largamente accettate di problemi fondamentali». Nell’articolo 
di H. DeLong viene posto in evidenza il fatto che l’avere dimostrato che ci sono 
problemi che è impossibile risolvere è una delle grandi conquiste della matematica: si 
tratta dei cosiddetti teoremi limitativi, che sembrano esprimere delle limitazioni delle 
facoltà umane, fra cui quello di incompletezza di K. Godei che viene discusso 
nell’articolo. 

Non è inutile sottolineare ancora la rilevanza delle teorie matematiche e degli 
strumenti algoritmici matematici ai fini delle applicazioni. È la matematica che si cala 
nella realtà come scienza concreta. A.M. Turing, vissuto nella prima metà di questo 
secolo, fu uno dei primi studiosi di calcolatori, e fra l’altro ideò una macchina, nota 
con il suo nome, che, come dimostrò, può essere programmata per realizzare 
qualsiasi operazione alla portata del più potente elaboratore elettronico. M. 
Gardner, nell’articolo che apre questa parte, dopo una descrizione di tale congegno 
idealizzato, tratta la questione sollevata dallo stesso Turing: può una macchina 
pensare?, che conduce a profonde e dialettiche controversie filosofiche. Un altro 
legame fra teoria e applicazione è mostrato nell’articolo di H. Wang nel quale si pone 
in luce che la questione di stabilire con ragionamenti logici la vincita o meno in un 
gioco è analoga al fatto che un problema si possa o meno risolvere mediante 
calcolatore e si evidenzia così lo stretto legame intercorrente tra giochi, logica e 
calcolatori. Un grosso problema con riflessi in campo applicativo, posto da Hilbert e 
per lungo tempo non risolto, riguarda la possibilità di descrivere una procedura 
meccanica grazie alla quale sia possibile saggiare ogni equazione diofantea per 
decidere se possiede soluzione. Y. Matyasevich ha mostrato che a tale quesito si 
risponde negativamente, cioè non esiste un tale algoritmo. Si tratta di un importante 
contributo alla conoscenza delle proprietà dei numeri illustrato da M. Davis e R. 
Hersh nel loro articolo. È noto che il punto focale della scienza dei calcolatori è lo 
studio degli algoritmi che sono processi, procedure, metodi graduati atti a fornire 
uno specifico output come risposta a uno specifico input. Nell’articolo di D.E. Knuth 
viene data una lucida esposizione di modelli algoritmici, sottolineando il fatto «che 
gli algoritmi si occupano innanzitutto di manipolazioni di simboli, che non rappre¬ 
sentano necessariamente numeri»: questo concetto è alla base del linguaggio dei 
calcolatori. La serie degli articoli si chiude con un articolo di E.C. Zeeman sulla re¬ 
cente teoria delle catastrofi. Con metodi topologici di recente elaborazione, è possibi¬ 
le descrivere i fenomeni discontinui e divergenti. Proprio per la sua vasta generalità e 
per il fatto che può essere applicato efficacemente in situazioni in cui forze e motiva¬ 
zioni che mutano gradualmente portano a cambiamenti comportamentali improvvisi, 
il metodo è stato chiamato «teoria delle catastrofi ». Molti esempi di catastrofi sono 
offerti da fenomeni fisici, ma applicazioni rilevanti della teoria possono essere 
effettuate in biologia e in scienze sociali, dove sono molto diffusi fenomeni disconti¬ 
nui e divergenti, e in cui altre tecniche matematiche si sono rivelate insufficienti. 

La panoramica del presente volume, seppure ampia, ovviamente non può ritenersi 
esaustiva, ma vuole soltanto offrire uno squarcio dei più rilevanti problemi fonda- 
mentali e applicativi nel campo matematico. È augurabile che anche questo volume 
possa trovare, come gli altri, favorevole accoglienza oltre che fra gli addetti ai lavori, 
pure fra coloro che sono desiderosi di approfondire la loro cultura e le proprie 
conoscenze sui più rilevanti problemi scientifici del nostro tempo. 


Napoli, aprile 1978. 


C.C. 
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LE SCIENZE 


NUMERO 61 


Settembre 1973 


Sui paradossi di Zenone 

di Martin Gardner 


U na nuova e divertente variante dei paradossi di Zenone è stata presentata 
da A. K. Austin dell’Università di Sheffield nel « Mathematics Magazine » 
del gennaio 1971. 

Un ragazzo, una ragazza e un cane si trovano nello stesso punto su una strada 
diritta. Il ragazzo e la ragazza camminano in avanti — il ragazzo a una velocità 
di quattro chilometri all’ora e la ragazza a tre chilometri all’ora. Mentre essi 
avanzano il cane corre avanti e indietro da uno all’altra a una velocità di 10 
chilometri all’ora. Supponiamo che ogni inversione di direzione avvenga in 
un tempo nullo. Dopo un’ora dove sarà il cane e verso chi sarà rivolto? 

Risposta: « Il cane può essere in un punto qualsiasi tra il ragazzo e la ragazza, 
e rivolto verso qualunque parte ». Dimostrazione: « Trascorsa un’ora, ponete 
il cane in un punto qualunque fra il ragazzo e la ragazza rivolto verso una di¬ 
rezione qualunque. Invertendo la successione temporale del movimento, tutti 
e tre, cane, ragazzo e ragazza, torneranno allo stesso istante nel punto di par¬ 
tenza ». 

Il paradosso di Austin, come ha subito notato Wesley C. Salmon dell’Uni¬ 
versità dell’Indiana, si può presentare sotto altre innumerevoli forme; una delle 
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più semplici è l’inversione temporale del noto enigma delle due locomotive e 
dell’uccello. Due locomotive distanti 30 chilometri partendo rispettivamente da 
A e da B si muovono sullo stesso binario una contro l’altra alla velocità di 15 
chilometri all’ora fino a che si scontrano in C. Un uccello partendo da A, vola 
avanti e indietro tra le due locomotive a 60 chilometri all’ora fino allo scontro. 
Qual è la lunghezza del percorso dell’uccello? In questo caso non occorre ricor¬ 
rere alla somma di una serie di infiniti termini; dato che l’uccello vola per 
un’ora, il percorso dovrà essere di 60 chilometri. Se si inverte la successione 
temporale degli eventi imponendo che l’uccello finisca in A, si determina un 
unico percorso a zig-zag che l’uccello può percorrere in entrambe le direzioni. 

Supponiamo però di non aver stabilito dove debba trovarsi l’uccello dopo che 
le locomotive stanno ritornando verso i punti A e B. Senza questa informazio¬ 
ne non è possibile determinare un percorso unico; infatti l’uccello ora può intra¬ 
prendere un numero infinito di percorsi e la sola cosa che possiamo dire è che 
esso alla fine si troverà in un punto qualsiasi tra A e B. 

E’ però realmente possibile fare questa affermazione? Molti matematici 
la contestano poiché nella versione con inversione temporale degli eventi emerge 
una singolarità che rende contraddittorie le condizioni iniziali. Un matematico 
potrebbe osservare: « In analisi non esiste una giustificazione valida in generale 
per invertire l’operatore limite ». Quando le locomotive si muovono una verso 
l’altra, è soltanto la posizione dell’uccello che converge. « Il vettore velocità 
diverge, sicché (come nel problema di Austin) si ripresenta la stessa difficoltà 
di invertire in modo univoco il processo di limite. Lo sviluppo delle regole 
ormai sancite del calcolo differenziale è dovuto proprio al fatto che tali regole, 
se si seguono correttamente, evitano contraddizioni ». 

Può essere di aiuto tracciare un grafico spazio-temporale del percorso del¬ 
l’uccello da A a C' (si veda la figura della pagina precedente ) Naturalmente non 
possiamo disegnare il percorso dell’uccello proprio fino in C' poiché gli zig-zag sono 
infiniti; possiamo però certamente supporre che una linea ideale esista. Se questa 
linea può scendere da A aC'è chiaro che non è possibile fare nessuna obiezione 
logica all’affermazione che essa può salire da C‘ ad A. Se non si specifica la de¬ 
stinazione finale dell’uccello, vi è una infinità più che numerabile di diagrammi 
di questo tipo che partono da C' e terminano in un punto qualsiasi del tratto 
tra A e B. E’ vero che non è possibile risolvere col calcolo problemi analoghi 
a quello di Austin, se « risolvere » significa fissare proprio la posizione finale 
del cane, ma una « soluzione » del problema di Austin è precisamente quella che 
mostra che ciò non è possibile. Poiché non si dice come parta il cane, esso 
può partire in qualsiasi modo gli piaccia purché rimanga sempre tra il ragazzo 
e la ragazza e di conseguenza il suo percorso può finire in un punto qualsiasi 
tra la ragazza e il ragazzo. 

Il commento di Salmon sul problema di Austin è stato il seguente. « Quasi 
tutti hanno udito la vecchia storia dell’uccello che vola avanti e indietro tra due 
locomotive che si avvicinano (quella che abbiamo raccontato prima). Per rispet¬ 
tare la prospettiva storica, supponiamo che Achille stia inseguendo la tartaruga 
mentre una mosca troiana vola avanti e indietro fra di loro. Dato un insieme 
di velocità e di distanze, e la certezza che Achille raggiungerà la tartaruga in un 
punto e a un istante ben determinato (si veda il mio libro Zeno’s Paradoxes, 
Bobbs-Merrill, 1970), possiamo facilmente capire quanto sarà lungo il percorso 
della mosca. Fin a questo punto non abbiamo nuovi paradossi “zenoniani”... 
Il problema di Austin è l’inverso temporale del problema del treno e dell’uccello.» 

« Sempre per rispettare la prospettiva storica, ritorniamo ad Achille e alla 
tartaruga. Achille, malgrado lo svantaggio iniziale che gli è imposto per tradi¬ 
zione, raggiunge la tartaruga e per riparare all’ingiustizia impostagli per lungo 
tempo da Zenone continua a correre aumentando costantemente il suo vantaggio 
sulla tartaruga. Consideriamo ora la mosca troiana che continua a tentar di 
volare avanti e indietro tra i due corridori anche dopo che il più veloce ha 
raggiunto il più lento. Quando Achille e la tartaruga sono alla pari, la mosca 
si trova nella stessa identica posizione del cane nel paradosso di Austin. » 

« Supponiamo per esempio che la tartaruga si muova alla velocità di un chi¬ 
lometro all’ora, Achille a cinque chilometri all’ora (sta correndo dal 500 a.C. 
perciò non è più veloce come una volta) e la mosca a 10 chilometri all’ora. Tutti 
arrivano senza difficoltà al comune punto di incontro. Ma come possono pro¬ 
seguire? Se i tre partono contemporaneamente dal punto in comune, la mosca 
o supera subito ambedue oppure si sposta dietro a entrambi; in ogni caso si 
viola la condizione iniziale che la mosca stia sempre nell’intervallo tra i due 
(inclusi gli estremi). Sembrerebbe di poter dire che in ogni intervallo di tempo 
e> 0, piccolo a piacere, la tartaruga percorre la distanza di 1e, Achille di 
5 e e la mosca di 10 e. Quindi, per quanto piccolo si prenda l’intervallo di tem¬ 
po, la mosca, dopo rincontro, non si trova più nel tratto tra la tartaruga e 
Achille. Perciò anche se abbiamo mostrato come Achille possa compiere la 
“superimpresa” di raggiungere la tartaruga e a sua volta la tartaruga quella 
di iniziare il suo moto, si vede che la mosca deve affrontare la “superimpresa” 
di continuare a volare avanti e indietro tra Achille e la tartaruga anche dopo 
che questa è stata raggiunta: la mosca deve riuscire a non superare Achille. » 

« A me sembra che il problema presenti una difficoltà evidente analoga a 


quella sottolineata da Zenone nel suo paradosso della dicotomia regressiva. 
Non c’è dubbio che se la mosca vola costantemente in una direzione senza 
tornare indietro, distanzierà sia Achille che la tartaruga, anche in un tempo e 
arbitrariamente piccolo. Questo tuttavia non rende impossibile il moto della 
mosca poiché per quanto piccolo si scelga l’intervallo di tempo, la mosca in 
questo intervallo avrà già invertito la sua direzione di moto (un numero 
infinito di volte, sicché sarà completamente stordita). Questo significa semplice- 
mente che non esiste un intervallo iniziale non nullo durante il quale la mosca 
vola dritta senza invertire la sua direzione; ne segue perciò che la mosca non 
può lasciare subito l’intervallo tra la tartaruga e Achille. In effetti possiamo 
vedere esattamente come i rapidi capovolgimenti permettano alla mosca di ri¬ 
manere sempre tra la tartaruga e Achille se esaminiamo l’inversione temporale 
del moto della mosca quando essa si avvicina al punto d’incontro. Il fatto che 
la mosca non possa compiere un percorso iniziale dritto non nullo è analogo al 
fatto che la tartaruga lasciando il suo punto di partenza non può attraversare 
un qualunque segmento iniziale non nullo del suo percorso. In entrambi i casi 
la mancanza di un opportuno segmento iniziale non è un grave ostacolo. » 

« La letteratura più recente sui paradossi di Zenone riporta molte discussioni 
sulle “macchine infinite”. Si tratta di dispositivi ideali che dovrebbero eseguire 
una serie infinita di compiti; sono stati introdotti nella discussione a causa 
delle difficoltà che sembra si incontrino nel portare a termine una serie infinita 
di compiti (una "superimpresa”). La soluzione dei problemi relativi alle mac¬ 
chine infinite è molto simile alla soluzione del paradosso di Zenone della dico¬ 
tomia espresso in forma progressiva. Esattamente le stesse considerazioni si 
possono applicare al moto della mosca troiana fino al momento in cui Achille 
raggiunge la tartaruga, quest’ultimo istante incluso. Non so se sia stato presentato 
esplicitamente il tipo di macchina infinita che sarebbe l’analogo del paradosso 
di Zenone della dicotomia in forma regressiva; una macchina la cui difficoltà 
consisterebbe nell’iniziare una serie infinita di prove a differenza della macchina 
infinita usuale la cui difficoltà consiste nel finire la sua serie di prove. La nostra 
mosca troiana, nel suo moto dal punto d’incontro di Achille con la tartaruga 
per tutta la parte successiva della corsa in cui Achille è davanti alla tartaruga, 
si comporta proprio come una macchina infinita (come pure il cane di Austin), 
potremmo dire una macchina infinita regressiva. Così come esiste uno stretto 
parallelismo tra il modo di trattare una macchina infinita e la soluzione del 
paradosso di Zenone della dicotomia in forma progressiva, dovrà pure esistere 
un parallelismo tra il modo di trattare la mosca troiana nella seconda parte 
del suo volo e la soluzione del paradosso in forma regressiva. » 

« Un altro problema sul movimento della mosca merita particolare attenzio¬ 
ne, e precisamente: qual è lo stato di moto della mosca nell’istante esatto 
delì’incontro? La posizione della mosca è ben determinata: essa coincide con la 
posizione di Achille e della tartaruga. Matematicamente si può descrivere la 
posizione della mosca con una funzione continua del tempo che all’istante asse¬ 
gnato passa per il punto di incontro. Viceversa la funzione velocità della mosca 
è discontinua. Il suo valore è + 10 quando la mosca si muove in avanti, —10 
quando essa si muove indietro e (possiamo dire) è zero quando la mosca si 
incontra con Achille o con la tartaruga (o con entrambi). Perciò nell’istante 
in cui tutti e tre si incontrano possiamo appropriatamente assegnare alla velocità 
della mosca il valore zero. E’ ovvio che la funzione velocità in vicinanza del 
punto d’incontro comune ha da entrambe le parti infiniti punti di discontinuità. 
A ogni discontinuità finita della funzione velocità corrisponde un punto di di¬ 
scontinuità infinita per l’accelerazione poiché per cambiare istantaneamente la 
velocità da + 10 a —10 e viceversa occorre un’accelerazione infinita. Inoltre, 
come si vede dal problema di Austin e dalla sua soluzione, lo stato di moto della 
mosca (o del cane) nel punto d’incontro non determina univocamente il tipo 
di moto che si avrà dopo. In altre parole, pur avendo mostrato come sia possibile 
(“possibile” in un certo senso) per la mosca continuare il suo movimento at¬ 
traverso e oltre il punto d’incontro, ci sono però infiniti modi distinti di eseguire 
questo moto, tutti consistenti con le condizioni imposte dal problema. Dire che 
ci sono vari modi alternativi di eseguire un compito non significa tuttavia 
dimostrare che il compito è impossibile. » 

«I paradossi di Achille e della dicotomia, nella formulazione usuale, com¬ 
portano un numero finito di discontinuità del tipo che si è appena menzionato: 
si fa l’ipotesi che Achille e la tartaruga, al punto di partenza, accelerino in modo 
da raggiungere istantaneamente le loro rispettive velocità medie e che alla fine 
decelerino istantaneamente fino a una velocità nulla. Analogamente moltissime 
delle “macchine infinite” (per esempio le macchine trasferitrici di Black e 
la lampada di Thomson) implicano un numero infinito di tali discontinuità che 
si accumulano attorno a un certo istante finale (si veda Zeno Paradoxes alle 
pagine 204-244). Facendo uso di una funzione matematica introdotta da Richard 
Friedberg, Adolf Grùnbaum ha mostrato come si possano modificare tali mo¬ 
vimenti in modo da eliminare tutte le discontinuità pur raggiungendo il risultato 
complessivo desiderato. Si potrebbe pensare di applicare tale metodo al problema 
della mosca troiana (o al terzetto di Austin ragazzo-ragazza-cane) al fine di 
ottenere una descrizione del moto a cui non si possa muovere nessuna obiezione. » 
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SCIENTIFIC AMERICAN 


Settembre 1964 


I fondamenti della matematica 

Quando si afferma una nuova idea in matematica, da essa sorge una 
sovrastruttura. Quindi Videa originale può rivelarsi fonte di difficoltà, 
che è conveniente eliminare per non distruggere la sovrastruttura 

di W.V. Quine 


I nconfutabilità, il tuo nome è mate¬ 
matica. Gli studiosi di scienze natu¬ 
rali accettino pure l’evidenza empiri¬ 
ca: il matematico chiede dimostrazioni. I 
criteri di scientificità devono essere di¬ 
ventati ben rigorosi se c’è qualcuno che 
si preoccupa dei fondamenti della mate¬ 
matica. Dove si potrebbero trovare fon¬ 
damenti certi come ciò che in questo 
caso si desidera fondare? 

L’interesse per i fondamenti della ma¬ 
tematica è stato spesso espresso in situa¬ 
zioni d’emergenza, quando le idee fon¬ 
damentali iniziano a sembrare instabili e 
i matematici sono obbligati a esaminarle. 
L’idea di infinitesimo fu soggetta a un 
tale esame molto tempo dopo che Isaac 
Newton e Gottfried Wilhelm von Leibniz 
svilupparono il calcolo infinitesimale. 
Questo concetto di quantità frazionaria 
infinitamente vicina allo zero, tuttavia 
differente dallo zero, forniva una fonda¬ 
zione allo studio dei tassi di variazione, 
l’argomento del calcolo differenziale. 

Si consideri una macchina che da fer¬ 
ma accelera fino a una velocità di 90 
miglia all’ora. Nell’istante in cui l’ago 
del tachimetro indica 60 sta procedendo 
alla velocità di un miglio al minuto, negli 
istanti precedenti la sua velocità era mi¬ 
nore, in quelli successivi sarà maggiore. 
La velocità istantanea di un miglio al 
minuto non consiste nel compiere un 
miglio al minuto, perché non è mante- 


Nella pagina a fronte il numero quattro è 
rappresentato come la classe contenente tut¬ 
te le classi di quattro elementi. La cornice 
esterna non è chiusa a destra perché gli esempi 
mostrati non esauriscono tutti gli elementi 
delia classe. Il titolo adeguato per il quadro 
completo sarebbe «4». Dire che una classe di 
tetraedri, di coni, di sfere o di cilindri ha 
quattro elementi significa dire che essa appar¬ 
tiene a «4». Questa concezione del numero è 
solo una tra le molte che sono state proposte 
dagli studiosi di fondamenti della matematica. 


nuta per un minuto. Di fatto la macchi¬ 
na non la mantiene per nessun tempo. 
La distanza coperta in ciascun istante è 
zero e la caratterizzazione «nessun mi¬ 
glio all’istante» elimina la distinzione tra 
una velocità e l’altra. Così i fondatori 
del calcolo infinitesimale assunsero l’esi¬ 
stenza di infinitesimi di poco diversi da 
zero e distinti fra loro. (Le frazioni sem¬ 
pre più piccole ci sono familiari, 1/8, 
1/16 e così via, ma esse non sono infini¬ 
tesimi; per definizione un infinitesimo 
sta in 1 non 16 volte ma un numero 
infinito di volte.) 

Andare alla velocità di un miglio al 
minuto significa superare la metà di quel¬ 
la distanza infinitesimale in quel tempo 
infinitesimale. L’assurdità di questo ap¬ 
proccio era ovvia, ma il calcolo risultan¬ 
te aveva reso possibile un ragionamento 
matematico sui tassi di variazione. Sorse 
così un problema caratteristico riguar¬ 
dante i fondamenti della matematica: co¬ 
me sbarazzarsi dell’infinitesimo sostituen¬ 
dolo con idee più chiare salvando nello 
stesso tempo la sovrastruttura utile. 

Nel XIX secolo, Augustin Cauchy e i 
suoi seguaci risolsero il problema. Si con¬ 
siderino intervalli di tempo sempre più 
corti in modo che ciascuno di essi inclu¬ 
da l’istante dato. Se su ciascun intervallo 
si scrive la distanza che la macchina ha 
percorso in esso, ogni rapporto distanza- 
-tempo sarà vicino a un miglio al minuto 
se l’intervallo di tempo è corto. Fissato 
comunque un intervallo di approssima¬ 
zione, esiste un intervallo di tempo tale 
che, per tutti gli intervalli all’interno di 
esso, i rapporti distanza-tempo si avvici¬ 
neranno a un miglio al minuto con l’ap¬ 
prossimazione stipulata. Una successione 
di rapporti distanza-tempo di questo ti¬ 
po, determinati su intervalli sempre più 
piccoli, tende a un limite (che può essere 
calcolato con la tecnica conosciuta come 


differenziazione). La 


concerne distanze brevi ma non infinite 


nozione di limite 


simali e può essere usata per definire 
cosa significa viaggiare alla velocità di 
un miglio al minuto in un dato istante. 

T 'infinitesimo non è il solo concetto 
matematico che deve essere legitti¬ 
mato o eliminato. Si pensi ai numeri im¬ 
maginari (le radici quadrate dei numeri 
negativi), frutto di un’idea sorta nel XVI 
secolo. Si elevi al quadrato un numero 
reale qualsiasi, negativo o positivo. Il 
risultato è positivo. Che cosa sono allora 
le radici quadrate dei numeri negativi? 
Come nel calcolo differenziale, anche in 
questo caso un esame dei fondamenti 
deve essere fatto con un occhio volto alla 
conservazione della sovrastruttura. 

La radice quadrata di —1 è l’unità 
immaginaria /. Gli altri numeri immagi¬ 
nari sono multipli ottenuti moltiplicando 
/ per i numeri reali. Il numero immagi¬ 
nario corrispondente al numero reale 3 è 
il numero immaginario 3/. Il numero 
immaginario corrispondente al numero 
reale 1/2 è il numero immaginario 1/2/. 
Quello corrispondente al numero reale n è 
il numero immaginario ni. I numeri im¬ 
maginari, costituiti in questo modo, si 
combinano con i numeri reali per mezzo 
dell’addizione, ottenendo in questo mo¬ 
do 3 + /, 71 + 2/ e cosi via: questi numeri 
sono conosciuti come numeri complessi e 
si rivelano particolarmente utili. Qualsia¬ 
si numero complesso è una comoda co¬ 
dificazione di due numeri reali x e y, 
ciascuno dei quali può essere riottenuto 
in maniera univoca a richiesta. Questa 
corrispondenza può essere rappresentata 
su un piano definito da un asse reale x e 
da un asse immaginario y (si veda l’illu¬ 
strazione della pagina seguente in basso). 
(Un esame retrospettivo mostra che il mi¬ 
stero dei numeri immaginari avrebbe po¬ 
tuto essere evitato poiché il ruolo dei 
numeri complessi può essere giocato da 
«coppie ordinate» di numeri reali. 

L’idea di coppia ordinata è utile in 
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Illustrazione dell’accelerazione da fermo. Le cinque strisce verticali rappresentano il medesimo 
tratto di strada lungo un miglio, considerato a intervalli di 15 secondi. Nei primi 15 secondi 
l’auto (in colore) avanza di circa 70 piedi. Nel quarto intervallo avanza 32 volte più lontano. 



T~ ~ 90 piedi/secondo 88,4 piedi/secondo ^3. = 551?= 88 piedi/secondo 

h lSj \2 10 I 3 4 


L'istante in cui l'auto raggiunge la velocità di un miglio al minuto è un punto sulla curva di 
accelerazione. (Questa sezione di curva corrisponde al rettangolo scuro della figura in alto.) I 
rapporti distanza-tempo in intervalli sempre più brevi tendono a un limite finito e determinabile. 
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Il numero complesso x+yì può essere rappresentato su un piano definito da un asse orizzontale 
reale e da un asse verticale immaginario. A sinistra vediamo i punti K (1 + 20 e H (2 + 0. Se que¬ 
sti punti e l’origine sono vertici di un parallelogrammo, il quarto vertice (P) è la loro somma. 


molte altre situazioni critiche della mate¬ 
matica. Il suo uso è sempre lo stesso: è 
un modo per considerare due cose come 
una sola senza per questo confonderle. 
Comunemente la coppia ordinata di x e 
di y, si tratti di numeri o di altre cose, 
come ad esempio padri e figli, è denotata 
(x, y). Non ho detto che cosa sia una 
coppia ordinata e di solito tale problema 
è evitato: ciò che è importante è come si 
comporta. L’unica proprietà che impor¬ 
ta è che se ( x, y) è ( z, w), allora x è z e y 
è w. 

Ho detto che in linea di principio il 
mito delle radici immaginarie potrebbe 
essere evitato. Tuttavia ha un valore: 
semplifica molto le leggi dell’algebra, un 
vantaggio che può essere conservato pur 
eliminando i numeri immaginari e quelli 
complessi. Questo si ottiene con una ma¬ 
novra che è comune negli studi fonda- 
zionali: definendo i numeri complessi co¬ 
me semplici coppie di numeri reali e 
quindi ridefinendo le solite operazioni 
algebriche di somma, moltiplicazione e 
potenza in modo tale che queste opera¬ 
zioni abbiano senso quando vengano ap¬ 
plicate alle coppie ordinate. In questo 
modo si possono ideare definizioni che 
forniscono un’algebra delle coppie ordi¬ 
nate che sia formalmente indistinguibile 
dall’algebra dei numeri complessi. Si po¬ 
trebbe dire che i numeri complessi sono 
stati spiegati in termini di coppie ordina¬ 
te, ma si potrebbe anche dire che sono 
stati eliminati in favore delle coppie or¬ 
dinate. 

Invece di dire semplicemente ciò che le 
coppie ordinate fanno, si potrebbe pro¬ 
seguire tentando di determinare che cosa 
sono. Questo problema non ha l’urgenza 
dei problemi sugli infinitesimi o sui nu¬ 
meri immaginari e ha un sapore più filo¬ 
sofico. Qualsiasi risposta, per quanto ar¬ 
tificiosa, servirà purché confermi la leg¬ 
ge delle coppie: se (*, y) è (z, w), allora x 
è z e y è w. Oggi la versione abitualmen¬ 
te adottata appartiene a Norbert Wiener 
e Casimir Kuratowski. Tale versione non 
identifica la coppia ordinata ( x, y) sem¬ 
plicemente con la classe i cui elementi 
sono x e y, dove si potrebbe confondere 
(x, y) con 0, x). Identifica (x, y) con la 
classe di due classi delle quali una è la 
classe il cui solo elemento è x, l’altra la 
classe i cui elementi sono x e y. Si può 
dire che si è data una spiegazione delle 
coppie ordinate in termini di classi di 
classi di due elementi, o che si sono 
eliminate le coppie ordinate in favore di 
queste classi di classi di due elementi. La 
differenza è puramente verbale, ma la 
prima descrizione ha il vantaggio di con¬ 
servare la notazione «(x, y)» e la parola 
«coppia». 

T problemi filosofici sembrano una via 
di mezzo fra le proteste indignate del 
senso comune offeso «Che cos’è un infi¬ 
nitesimo? Che cos’è la radice quadrata di 
un numero negativo?», e le domande 
petulanti di un bambino annoiato in un 
sabato piovoso. Un problema filosofico 
più profondo di quello riguardante le 
coppie ordinate è: «Che cosa sono i nu- 
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La funzione radice quadrata può essere rappresentata per mezzo di 
una cornice, aperta in basso, contenente le coppie ordinate ( a,b) per le 
quali vale la relazione «b è uguale ad a volte a». Ciascuna coppia 
ordinata viene identificata con una classe di due elementi. Il primo 
elemento è dato dalla classe che si trova a sinistra in ogni cornice, il 
cui unico elemento è il primo della coppia. Il secondo elemento è la 


classe che si trova a sinistra contenente i due elementi della coppia. 
Usando questa convenzione, la coppia in basso (3,9) non può essere 
confusa con (9,3), coppia che appartiene alla funzione elevamento al 
quadrato. L’introduzione di questa rappresentazione astratta delle 
coppie ordinate, che è usata molto frequentemente nella matematica mo¬ 
derna, è dovuta all’opera di Norbert Wiener e di Casimir Kuratowski. 
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Il numero naturale quattro viene considerato come la classe di tutte le classi di quattro elementi, 
quindi la cornice esterna non è chiusa. Seguendo questa definizione di numero, suggerita per la 
prima volta alla fine dell’ottocento da Gottlob Frege, il numero 1 può essere considerato 
come la classe di tutte le classi che appartengono a 0 quando siano private di un elemento. 



La definizione di John von Neumann del numero naturale 4 sottolinea l'esistenza di una corri¬ 
spondenza biunivoca (indicata dalle frecce) con una classe di quattro elementi. Tre elementi co¬ 
stituenti questa classe sono definiti per mezzo di una corrispondenza mentre, Faltro è la classe vuota. 



N " ' ~ 71 



Il numero reale 4 è rappresentato come la classe, illimitata in basso (cornice esterna ), di tutte le 
coppie ordinate ( a,b ) in cui a è meno di quattro volte b. Questa è la relazione che 3 ha con 1, 7 
con 2, 11 con 3. Questa convenzione si applica sia ai numeri frazionari sia a quelli negativi. 


meri?» Consideriamo questo problema 
prima in relazione ai numeri naturali che 
comprendono gli interi positivi e lo zero. 

I numerali sono nomi per, ossia deno¬ 
tano, i numeri. Il simbolo «12» denota il 
numero 12. Possiamo riformulare il pro¬ 
blema nel modo seguente: Che cosa de¬ 
notano i numerali? Che cos’è il numero 
12? Vi erano 12 apostoli ci sono 12 uova 
in un cestino e 12 mesi in un anno. Ma 
12 non è solo una proprietà delle dozzine 
di uova, dei mesi e degli Apostoli, è la 
proprietà comune alla classe compren¬ 
dente una dozzina di uova, alla classe 
comprendente una dozzina di mesi, e a 
quella comprendente una dozzina di A- 
postoli. 

In matematica gran parte della chiar- 
rezza è dovuta alla tendenza a parlare di 
classi piuttosto che di proprietà. Qualun¬ 
que cosa possa ottenersi riferendosi a una 
proprietà, può generalmente ottenersi al¬ 
trettanto bene anche riferendosi alla classe 
di tutte le cose che godono di tale pro¬ 
prietà. Si guadagna in chiarezza perchè, 
parlando di classi, si può stabilire più 
chiaramente un criterio di identità e di 
differenza; esso consiste semplicemente 
nell’avere o nel non avere il medesimo 
numero di elementi. 

In particolare, quindi, è meglio spie¬ 
gare il numero 12 non come la proprietà 
di essere una dozzina, ma come la classe 
di tutte le dozzine, la classe di tutte le 
classi di 12 elementi. Ciascun numero 
naturale n diventa la classe di tutte le 
classi di n elementi. La circolarità che 
consiste nell’usare n per definire n può 
essere evitata definendo ogni numero nei 
termini del suo predecessore. Una volta 
che si è ottenuto il numero 5, per esem¬ 
pio, si può definire il numero 6 come la 
classe di tutte le classi che, private di un 
elemento, appartengono a 5. Iniziando 
dal principio si può definire lo zero come 
la classe il cui solo elemento è la classe 
vuota; poi l’uno come la classe delle 
classi che, private di un elemento, appar¬ 
tengono a zero, poi il due come la classe 
di quelle classi che private di un elemen¬ 
to, appartengono a uno, e così via. 

Proprio come ogni definizione di cop¬ 
pia ordinata serve allo stesso scopo se 
soddisfa la legge delle coppie, così ogni 
definizione di numero naturale servirà 
allo scopo se soddisfa questa legge: esiste 
un primo numero e un’operazione di 
successore che produce qualcosa di nuo¬ 
vo ogni volta. La precedente definizione 
di numero, presentata da Gottlob Frege 
nel 1884, soddisfa al requisito (si veda 
l’illustrazione in alto in questa pagina). 
Ciò vale anche per altre definizioni. La 
definizione di John von Neumann identi¬ 
fica ciascun numero con la classe di tutti 
i numeri che lo precedono (si veda l’illu¬ 
strazione al centro in questa pagina). In 
questo sistema 0 è la classe vuota; 1 la 
classe il cui solo elemento è zero e 2 la 
classe formata da 0 e 1. Dove Frege 
direbbe che una classe di n elementi ap¬ 
partiene a n, von Neumann dice che una 
classe di n elementi è quella i cui n 
elementi possono mettersi in corrispon¬ 
denza biunivoca con gli elementi di n. 
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Se si considerano i numeri nell'una e 
nell’altra di queste definizioni, o in qual¬ 
che altra ancora, un passo successivo è 
quello di definire le operazioni aritmeti¬ 
che. L’idea che sta dietro l’addizione è 
evidente: m+n è il numero degli elemen¬ 
ti di una classe se parte di essa ha m 
elementi e il resto ne ha n. Il prodotto 
m x n è il numero degli elementi di una 
classe costituita da m parti di n elementi. 


PROPOSIZIONE RIGUARDANTE n 


n è un numero primo 


n è un numero naturale e, presi comunque 
due numeri naturali h e k, se n = h x k, 
allora h o k è 1. 


n è un numero naturale e presi comunque 
due numeri naturali h e 1 1, se una classe di 
n elementi è suddivisa in h parti aventi k 
elementi ognuna, allora h o k è 1. 


n è un numero naturale e presi comunque 
due numeri naturali h e k, se per ogni 
elemento x di n esiste un elemento y di h 
tale che tutti gli elementi di y sono elemen¬ 
ti di k e nessun elemento di y ha elementi 
in comune con qualche altro elemento di y 
e tutti e solo gli elementi degli elementi di 
y sono elementi di x, allora ftofièl. 


■ on si è ancora data una spiegazione 
dei numeri negativi, di quelli fra¬ 
zionari e di tutti i numeri irrazionali 
come \[2 e n; in breve di tutti i numeri 
reali eccetto i numeri naturali. Qui di 
nuovo qualsiasi definizione andrà bene 
se è in accordo con certe richieste. Da un 
punto di vista generale dotato di grande 
unitarietà è possibile definire un numero 
reale come una certa relazione tra nume- 


ESPRESSIONI DA DEFINIRE 


numero primo 


n è h x k 


x è suddiviso in h parti 
aventi k elementi ognuna 


n è un numero naturale 


successore 


ri naturali: di fatto una relazione basata 
su un paragone di grandezza. Per esem¬ 
pio, il numero reale 1/2 si identifica con 
la relazione che 1 ha con ciascun intero a 
partire da 3 in poi, e che 2 ha con 
ciascun intero a partire da 5 in poi, e 
così via. Similmente, ogni numero reale 
positivo x s’identifica con la relazione 
«essere grande meno di x volte». Il nu¬ 
mero reale 1/ti, per esempio, è conside- 


DEFINIZIONI DELLE ESPRESSIONI 


n è un numero naturale e, presi comunque 
due numeri naturali h e k, se n è h x k, 
allora h o k è 1. 


Una classe di n elementi è suddivisa in h 
parti aventi ognuna k elementi. 


Esiste una classe y di h elementi tale che 
ciascun elemento di y ha k elementi e 
nessun elemento di y ha elementi comuni 
con qualche altro elemento di y e tutti e 
soli gli elementi di y sono elementi di x. 


n elemento di ogni classe z tale che 0 è 
elemento di z e tutti i successori di elemen¬ 
ti di z sono elementi di z. 


0 è la classe il cui solo elemento è la classe 
senza elementi. 

Il successore di un m qualsiasi è la classe 
di tutte le classi che, private di un elemen¬ 
to, appartengono a m. 


1 è la classe di tutte le classi che, private di 
un elemento, diventano la classe senza e- 
lementi. 


n è un elemento di ogni classe z tale che la 
classe il cui solo elemento è la classe 
senza elementi è un elemento di z e, per 
ogni elemento m di z la classe di tutte le 
classi che, private di un elemento, appar¬ 
tengono am.èun elemento di z e, per tutti 
gli h e k che sono elementi di ogni classe z 
tale che la classe, il cui solo elemento è la 
classe senza elementi, è un elemento di z 


e, per ogni elemento m di z la classe di tut¬ 
te le classi che, private di un elemento, ap¬ 


partengono a m, è elemento di z, se per 
ogni elemento x di n esiste un elemento y 
di h tale che tutti gli elementi di y sono ele¬ 
menti di he nessun elemento di y ha ele¬ 
menti comuni con qualche altro elemento 
di y e tutti e soli gli elementi degli elementi 
di y sono elementi di x, allora h o k è la 
classe di tutte le classi che, private di un 
elemento, sono la classe senza elementi. 


La proposizione semplificata è in basso a sinistra in questo schema. 
La definizione della proposizione «n è un numero primo» produce un 
vocabolario di espressioni (colonna centrale) che a loro volta devono 
essere definite (colonna a destra). La proposizione finale ha a che fare 


solo con l’appartenenza a classi. Essa potrebbe riscriversi usando solo 
le locuzioni «e», «non», «è un elemento di» e il quantificatore uni¬ 
versale «ogni x tale che ...x...», se non si hanno problemi di bre¬ 
vità. La definizione di numero usata è stata sviluppata da G. Frege. 
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rato come la relazione che 1 ha con tutti 
i numeri interi da 4 in poi, che 2 ha con 
tutti i numeri interi da 7 in poi, che 3 ha 
con tutti i numeri interi da 10 in poi, e 
così via. Per quanto riguarda i numeri 
reali negativi, questi sono considerati co¬ 
me le relazioni converse; poiché 1/2 è la 
relazione «essere grande meno della me¬ 
tà», —1/2 è la relazione «essere grande 
più di due volte». 

A rischio di aumentare lo strepito, 
come fa il bambino nel sabato piovoso, 
si potrebbe chiedere: che cos’è una rela¬ 
zione? Come è stato suggerito nella di¬ 
scussione sulle coppie ordinate, si può 
identificare una relazione con la classe di 
tutte le coppie ordinate (a, b) tali che a 
sta nella relazione in questione con b. In 


questo modo i numeri reali sono in ulti¬ 
ma analisi identificati con classi, come è 
accaduto prima per i numeri naturali. Il 
numero 1/2 diventa la classe di tutte le 
coppie ordinate (a, b) tali che a è grande 
meno della metà di b. Mentre la classe 
delle coppie ordinate identificate con 1/2 
non può contenere la coppia (2,4) senza 
violare la relazione «meno di» (in tal 
caso infatti a sarebbe grande esattamente 
x volte b ), potrebbe invece contenere la 
coppia ordinata (20,41) o qualsiasi cop¬ 
pia ordinata in cui a sia vicino quanto si 
vuole all’essere grande x volte b. 

Ogni numero reale, dunque, corrispon¬ 
de a una classe distinta di coppie ordina¬ 
te. Questa distinzione può essere dimo¬ 
strata per 1’esistenza di un numero razio¬ 


nale tra due punti qualsiasi sulla retta dei 
numeri reali. Cioè, se x e y sono numeri 
reali diversi (per esempio x è minore di 
y), allora esiste un numero razionale a/b 
(dove a e b sono interi) tale che a/b è 
minore di y ma maggiore di x. Allora la 
coppia ordinata ( a,b ) farà parte della 
classe che corrisponde a y ma non di 
quella che corrisponde a x, e in questo 
modo vengono distinte le due classi. 

La descrizione del numero reale positi¬ 
vo x nei termini della relazione «grande 
meno di x volte» presenta lo stesso tipo 
di circolarità che si notò nella descrizio¬ 
ne di n come la classe di tutte le classi di 
ri elementi. Ma in questo caso, come in 
quello precedente, la descrizione ci aiuta 
a capire quali oggetti debbano essere i 
numeri. La ragione per cui serve è che 
l’uso circolare di ««» o di «x» all’interno 
della descrizione dipende dal contesto, 
che è quello del senso comune. La circo¬ 
larità può essere effettivamente eliminata 
in entrambi i casi per mezzo di defini¬ 
zioni accurate e complesse. 

Si deve adottare una definizione di 
numero naturale prima di costruire i nu¬ 
meri reali perché abbiamo considerato 
questi ultimi come relazioni definite sui 
numeri naturali. I numeri naturali devo¬ 
no quindi essere considerati distinti, al¬ 
meno in linea di principio, dai numeri 
reali corrispondenti. Il numero reale 5, 
per esempio, è considerato la classe di 
tutte le coppie ordinate ( a,b ) di numeri 
naturali tali che a è grande meno di 
cinque volte b. 

Il concetto di funzione in matematica 
è importante almeno quanto quello di 
numero, tuttavia il problema filosofico 
di che cosa sia una funzione può essere 
risolto in modo più spiccio, rispetto a 
quello riguardante i numeri. Una funzio¬ 
ne si può identificare con la relazione 
che esiste tra gli argomenti e i valori 
della funzione. La funzione «radice qua¬ 
drata di» può essere considerata come la 
relazione che sussiste tra la radice e il 
quadrato: la relazione che 0 ha con 0, 
che 1 ha con 1, che 2 ha con 4, che 2/3 
ha con 4/9, e così via. In questo modo la 
funzione radice quadrata diventa la clas¬ 
se di tutte le coppie ordinate (0,0), (1,1), 
(2,4), (2/3,4/9), in generale (x,x 2 ). L’il¬ 
lustrazione di pagina 19 rappresenta que¬ 
sta funzione come una classe. 

Gli esempi di ricerca nel campo dei 
fondamenti della matematica che abbia¬ 
mo visto prendevano l’avvio dal presen¬ 
tarsi di certe difficoltà per terminare in 
una risistemazione generale. Si tratta di 
un processo di riduzione di alcune nozio¬ 
ni a altre e perciò di riduzione dell’insieme 
dei concetti matematici fondamentali. 
Applichiamo questa tecnica nella ridu¬ 
zione di una nozione familiare, cioè la 
definizione di numero primo, nelle sue 
componenti elementari, scrivendo detta¬ 
gliatamente tutte le definizioni successive 
e prendendo nota di tutti gli strumenti 
logici e matematici che sono usati in es¬ 
se. Ciascuna definizione deve spiegare 
come eliminare qualche locuzione, o co¬ 
me eliminare gli enunciati in cui com¬ 
paiono tali locuzioni, parafrasandola in 


NUMERO 

PASSO 

GIUSTIFICAZIONE 

1 

x = x - (y - y), 

ASSIOMA 

2 

x - (y - z) = z - (y x) 

ASSIOMA 





(Da questi assiomi si derivano i teoremi sostituendo un termine qualsiasi in tutte 
le occorrenze di una variabile qualsiasi oppure, data un’equazione, rimpiazzando 
ovunque il suo primo membro al posto del secondo membro). 





3 

Z = Z - (y - y) 

PASSO 1 

4 

M 

li 

1 

x" 

X 

PASSO 3 

5 

y =- y = (y - y) - (x - x) 

PASSO 4 

6 

X — (x — z) = z — (x — x) 

PASSO 2 

.7 

x — (x — (y — y» = (y - y) - (x - x) 

PASSO 6 

8 

x - X = (y - y) - (X - x) 

PASSI 1,7 

9 

x — x = y — y 

PASSI 5,8 





(L'espressione «x + y» può definirsi come un’abbreviazione per «x - ((y -y) - y)». 
Le leggi dell’addizione diventano così semplici abbreviazioni delle leggi della 
sottrazione. Quindi la legge «x + y = y + x» si dimostra nel modo seguente.) 





10 

x - ((x - x) - y) = y - ((x — x) — x) 

PASSO 2 

11 

X 

X 

1 

X 

1 

>. 

Il 

> 

1 

> 

1 

1 

X 

PASSI 9,10 

12 

x + y = y + x 

PASSO 11, DEFINIZIONE 


La procedura di dimostrazione per l’addizione e la sottrazione in aritmetica inizia con equazioni 
(Passi lei) prese come assiomi. Poi vengono definiti i passi per derivare i teoremi per mezzo di 
sostituzioni. I passi 3-9 seguono dai passi precedenti elencati nella colonna a destra. L’addizione 
viene definita nei termini della sottrazione prima che le sue leggi siano dimostrate (Passi 10-12). 
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un vocabolario sempre più ristretto che 
alla fine si riduce a termini elementari. 
Iniziamo trasformando l’enunciato 

n è un numero primo 
in 

n è un numero naturale e, presi co¬ 
munque due numeri naturali h e k, se n 
è h x k, allora h o k è 1. 

Il primo passo ha eliminato la locuzio¬ 
ne «numero primo» dal vocabolario, ma 
nel vocabolario restante è rimasta la lo¬ 
cuzione «n è un numero naturale», la 
notazione per la moltiplicazione di h per 
A: e la notazione per 1. Sappiamo come 
eliminare la notazione per la moltiplica¬ 
zione scrivendo, al posto di n = hxk, 
che 

una classe di n elementi è ripartita in h 
parti aventi ciascuna k elementi. 

Per sostituire la nozione di «parte» di 
una classe con il concetto più semplice di 
appartenenza, questa espressione può es¬ 
sere trasformata nella seguente: 

per ogni classe x con n elementi esiste 
una classe y con h elementi tale che 
ciascun elemento di y ha k elementi, 
nessun elemento di y ha elementi comuni 
con qualche altro elemento di y e tutti e 
soli gli elementi degli elementi di y sono 
elementi di x. 

La scomodità aumenta velocemente, 
ma il vocabolario è stato ridotto in ter¬ 
mini di appartenenza a classi. Ora si può 
eliminare <or ha n elementi» ed espressio¬ 
ni analoghe. Se si usa la definizione di 
Frege dei numeri naturali, l’enunciato 
menzionato sopra diventa «x è un elemen¬ 
to di n». La frase da cui eravamo partiti 
viene ora analizzata nel modo seguente: 

n è un numero naturale e presi comun¬ 
que due numeri naturali h e k, se per 
ogni elemento x di n esiste un elemento y 
di h tale che tutti gli elementi di y sono 
elementi di k e nessun elemento di y ha 
elementi in comune con qualche altro 
elemento di y e tutti e soli gli elementi 
degli elementi di y sono elementi di x, 
allora h o k è 1. 

La diminuzione di chiarezza è meno 
importante della riduzione del vocabola¬ 
rio. Volendo maggior chiarezza le locu¬ 
zioni eliminate possono essere reintro¬ 
dotte come definizioni abbreviate. 

La prossima espressione da eliminare è 
«è un numero naturale» (predicato di n, 
h e k). Dire che n è un numero naturale è 
come dire che nè 0 oppure un successore 
di 0 o un successore di quest’ultimo e 
così via. Frege mostrò come evitare l’i¬ 
dea del «così via» definendo un numero 
naturale come 

un elemento di ogni classe z tale che 0 
è elemento di z e tutti i successori di 
elementi di z sono elementi di z. 


Frege considerò lo «0» come la classe 
il cui solo elemento è la classe senza 
elementi e il successore di un m qualsiasi 
come la classe di tutte quelle classi che, 
private di un elemento, appartengono a 
m. Se si eliminano le espressioni «0» e 
«successore» nel riscrivere la precedente 
versione di «è un numero naturale», e 
quindi si usa tale risultato per riscrivere 
la proposizione originaria, si finisce con 
una lunga storia raccontata con un voca¬ 
bolario ridotto (si veda l’illustrazione di 
pagina 21). Anche il numero «1», alla 
fine della definizione intermedia, viene 
eliminato, perchè 1 è successore di 0. Il 
vocabolario che rimane è formato da 
termini che riguardano l’appartenenza a 
classi e poco altro: un assortimento di 
particelle logiche elementari come «è», 
«e», «o», «se...allora», «ogni», «tutti» e 
simili. 

Con un passo ulteriore tutte queste 
particelle possono essere ridotte a locu¬ 
zioni fondamentali. Una di queste è «e», 
inteso come connettivo proposizionale. 
Un’altra è «non». Una terza è costituita 
dal quantificatore universale «ogni x tale 
che ...x ...» (dove ...x... è un’espressione 
solitamente contenente la variabile x). Il 
prefisso «ogni x è tale che» viene espresso 
in modo compatto col simbolo (x). Infine 
vi è il verbo «G» che significa «è un 
elemento di». Questa lista dovrebbe in¬ 
cludere anche le parentesi usate per rag¬ 
gruppare le proposizioni. La seguente 
breve proposizione illustra questo tipo di 
notazione: 

(x) non (y) non (x G y e non y G x) 

Ciò significa: «Ogni cosa è elemento 
di qualcosa che non è suo elemento». 

Ogni proposizione esprimibile nella 
notazione della matematica pura, sia nel¬ 
l’aritmetica sia nell’analisi (o in altre 
teorie), può essere parafrasata in questo 
vocabolario esiguo, anche se non con la 
stessa brevità di prima. L’espressione a 
cui siamo arrivati analizzando «n è un 
numero primo» è ancora chiara in con¬ 
fronto a quella che si otterrebbe limitan¬ 
do il vocabolario alle cinque locuzioni 
fondamentali. Questé cinque locuzioni 
non sono raccomandate come una lingua 
franca della matematica, nè come un 
mezzo pratico di computazione. Ma è un 
fatto interessante da un punto di vista 
teorico che un così gran numero di idee 
matematiche possa essere generato a par¬ 
tire da una base così ridotta, e da questa 
base in particolare. 

Q uattro delle cinque locuzioni fonda- 
mentali appartengono alla logica. 
Una è caratteristica della teoria degli in¬ 
siemi: «G». Si potrebbe dire che tutte e 
cinque appartengono alla teoria degli in¬ 
siemi, dato che le locuzioni logiche sono 
contenute in ogni teoria e quindi anche 
nella teoria degli insiemi. 

Sembrerebbe quindi che tutta la mate¬ 
matica possa essere riscritta nel vocabo¬ 
lario della teoria degli insiemi. Ogni pro¬ 
blema matematico potrebbe essere tra¬ 
sformato in un problema della teoria 


degli insiemi, quindi o questo fatto è 
promettente per la soluzione dei proble¬ 
mi della matematica oppure anche la 
teoria degli insiemi è essenzialmente pro¬ 
blematica quanto la matematica classica. 

Si tratta del secondo caso. E l’aspetto 
peggiore della teoria degli insiemi non è 
quello di poter formulare in essa propo¬ 
sizioni la cui verità è difficile da dimo¬ 
strare, ma che in essa si possono formu¬ 
lare proposizioni di cui è anche troppo 
facile dimostrare contemporaneamente la 
verità e la falsità. Una di queste è la 
proposizione 

non (y) non (x) [non (x G y e x G x) e 
non (non x G y e non x G x)]. 

Parzialmente riscritta, con un occhio vol¬ 
to alla normale comunicazione umana, 
suona così: 

Esiste almeno un y tale che (x) (x G y 
se e solo se non x G x). 

Sembra una proposizione vera: basta 
considerare come y la classe di tutte le 
cose x tali che jc non è elemento di se 
stesso. Tuttavia tale proposizione è an¬ 
che falsa: considerato un y come il pre¬ 
cedente si potrebbe prendere in partico¬ 
lare x uguale a y e concludere, in modo 
contraddittorio, che y G y se e solo se 
non y G y. 

Questo paradosso, scoperto da Ber¬ 
trand Russell nel 1901, è il più semplice 
fra i paradossi della teoria degli insiemi. 
La morale che si può trarre da essi è che, 
data una condizione necessaria e suffi¬ 
ciente di appartenenza a una classe, que¬ 
sta condizione non garantisce l’esistenza 
di tale classe. Il paradosso di Russell 
mostra in particolare che non esiste la 
classe di tutte le cose che non sono ele¬ 
menti di se stesse. Di conseguenza il 
grande compito della teoria degli insiemi 
consiste nel decidere quali classi esista¬ 
no. Non si conosce alcuna risposta natu¬ 
rale e indiscutibile; quella che sembrava 
la risposta più naturale, quella che esi¬ 
stesse una classe per ogni condizione di 
appartenenza, è insostenibile. 

A partire dal 1901 si è verificata una 
proliferazione di teorie degli insiemi, ma 
nessuna di esse si rivelò migliore delle 
altre. Anche la non contraddittorietà di¬ 
venta problematica, perchè non si può 
più aver fiducia nel senso comune per 
quanto riguarda la plausibilità delle pro¬ 
posizioni. Nella teoria degli insiemi il 
senso comune è stato screditato dai para¬ 
dossi. Come fondamento della matema¬ 
tica la teoria degli insiemi è molto meno 
solida di ciò che è fondato su essa. 

Chiaramente non si deve considerare 
la fondazione della matematica sulla teo¬ 
ria degli insiemi come un modo per dissi¬ 
pare i timori riguardanti la solidità della 
matematica classica. Ciò che si sta cer¬ 
cando nel valutare 1 diversi progetti per 
una teoria degli insiemi è uno schema 
che riproduca nella sovrastruttura le leg¬ 
gi accettate della matematica classica. Ci 
troviamo a considerare la teoria degli 
insiemi come un vocabolario convenien- 
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temente ristretto in cui formulare un si¬ 
stema generale di assiomi per la matema¬ 
tica classica, qualunque cosa possano es¬ 
sere gli insiemi. 

T Tn tale programma di assiomatizzazio- 
ne non può mai essere completato. 
Non c’è nessuna speranza di trovare una 
procedura di dimostrazione abbastanza 
forte da permettere di ottenere tutte le 
verità della matematica classica, o anche 
solo quelle dell'aritmetica, e da escludere 
tutte le proposizioni false. Questo im¬ 
portante risultato fu dimostrato da Go¬ 
dei nel 1931. 

La procedura di dimostrazione per la 
addizione e la sottrazione mostrata nel¬ 
l’illustrazione di pagina 22 è completa: 
ogni verità che può essere espressa nella 
notazione può essere dimostrata con tale 
procedura. Questa notazione, tuttavia, 
copre solo pochi aspetti dell’aritmetica, 
tralasciando la moltiplicazione e gli ope¬ 
ratori logici. Se la notazione venisse am¬ 
pliata per far fronte a questi ulteriori 
scopi, allora nessuna procedura di dimo¬ 
strazione potrebbe far ottenere tutte le 
verità esprimibili, evitando nello stesso 
tempo le proposizioni false. Questo si 
verifica anche se si limitano i valori delle 
variabili ai numeri naturali. 


Nella notazione della cosiddetta teoria 
elementare dei numeri possiamo espri¬ 
mere, per esempio, la seguente proposi¬ 
zione vera: 

(x) (y) non (z) [non (x = y + z) e non 
(y = x + z)]. 

Questo equivale a dire che, presi comun¬ 
que due numeri naturali x e y, o x=y+z 
oppure y = x + z, per qualche numero na¬ 
turale z . Godei dimostrò che, data una 
procedura di dimostrazione, è possibile 
costruire una proposizione, espressa in 
questa scarna notazione, che è falsa se 
può essere dimostrata in tale procedura, 
e vera se non può essere dimostrata. 
Quindi Godei concluse che la procedura 
data o non è valida, in quanto permette 
di dimostrare proposizioni false, oppure 
è incompleta, in quanto non permette di 
dimostrare proposizioni vere della teoria 
elementare dei numeri. 

La scoperta di Godei fu uno shock. 
Infatti si supponeva che l’essenza delle 
verità matematica fosse la dimostrabili¬ 
tà. Le cose tuttavia stavano diversamen¬ 
te. Ogni proposizione esprimibile in que¬ 
sta notazione scarna e perspicua della 
teoria elementare di numeri è dotata di 
significato, per ogni proposizione vale 


che è vera o falsa e che essa o la sua 
negazione sono derivabili; tuttavia la ve¬ 
rità non assicura la dimostrabilità. La 
differenza tra la verità matematica e 
quella delle scienze naturali è forse meno 
netta di quanto si pensi. 

Lo studio sui fondamenti della mate¬ 
matica può aver a che fare con concetti e 
con leggi. In buona parte di questo arti¬ 
colo abbiamo lavorato su concetti, per 
esempio tramite la riduzione dei concetti 
per mezzo della definizione di alcuni di 
essi nei termini di altri. 

Ma la scoperta di Gòdel si riferisce 
allo studio delle leggi e alla loro codifica 
in assiomi e regole di dimostrazione. La 
importanza di questo tipo di lavoro non 
fu sminuita dalla conclusione che non si 
possono ottenere sistemi completi per im¬ 
portanti rami della matematica; se ne 
possono ottenere di incompleti che sono 
illuminanti per varie ragioni. 

Di fatto il risultato di Gòdel ha stimo¬ 
lato fortemente gli studi fondazionali de¬ 
dicati alle leggi. Le notevoli tecniche" u- 
sate nella dimostrazione di Gòdel hanno 
dato origine a una importante branca 
della matematica: la teoria della dimostra¬ 
zione. Ecco ad esempio un caso in cui la 
fondazione ha dato origine alla sovra¬ 
struttura. 
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La teoria non cantoriana 
degli insiemi 

Nel 1963 è stato dimostrato che una celebre ipotesi avanzata da 
Georg Cantor non può essere dimostrata. Questo risultato viene 
illustrato mediante un’analogia con la geometria non euclidea 

di Paul J. Cohen e Reuben Hersh 


L a teoria astratta degli insiemi si 
trova attualmente in uno stadio 
di evoluzione che da molti pun¬ 
ti di vista è analogo alla rivoluzione 
verificatasi in geometria nel XIX seco¬ 
lo. Come in ogni rivoluzione, sia essa 
politica o scientifica, è difficile, per co¬ 
loro che vi partecipano o ne sono testi¬ 
moni, prevederne le estreme conseguen¬ 
ze, salvo forse affermare che esse sa¬ 
ranno profonde. Una cosa che si può 
fare è tentare di usare il passato come 
guida per il futuro: non si tratta certo 
di una guida degna di affidamento, ma 
è sempre meglio che niente. 

In questo articolo ci proponiamo di 
servirci della ormai vecchia storia del¬ 
la geometria non euclidea per illumi¬ 
nare la storia, oggi in pieno sviluppo, 
della teoria non standard degli insiemi. 

Quella di insieme è una delle idee 
più semplici e primitive della matema¬ 
tica, tanto semplice che ai nostri giorni 
può essere introdotta a livelli scolastici 
elementari. Indubbiamente, proprio per 
questa ragione, la sua natura di concet¬ 
to fondamentale di tutta la matematica 
non è stata messa in luce che attorno al 
1880: solo in quel periodo Georg Can¬ 


tor fece la prima scoperta non banale 
nell’ambito della teoria degli insiemi. 

Per descrivere la sua scoperta dob¬ 
biamo dapprima spiegare cosa inten¬ 
diamo per insieme infinito. Un insieme 
infinito è semplicemente un insieme che 
ha un numero infinito di elementi di¬ 
stinti; ad esempio l’insieme di tutti i 
numeri « naturali » (1, 2, 3, ecc.) è in¬ 
finito, come infinito è l’insieme di tutti 
i punti di un dato segmento. 

Cantor fece rilevare che anche per 
insiemi infiniti era sensato parlare del 
numero degli elementi nell’insieme, o 
per lo meno aveva senso affermare che 
due insiemi diversi hanno lo stesso nu¬ 
mero di elementi. Proprio come nel ca¬ 
so di insiemi finiti, possiamo dire che 
due insiemi infiniti hanno lo stesso nu¬ 
mero di elementi —- la stessa « cardi- 
nalità » — se possiamo associare uno 
per uno gli elementi dei due insiemi, 
ossia se possiamo stabilire una corri¬ 
spondenza biunivoca fra i due insiemi. 
Se ciò è possibile diciamo che i due 
insiemi sono equipotenti. 

L’insieme di tutti i numeri naturali 
può essere posto in corrispondenza biu¬ 
nivoca con l’insieme di tutti i numeri 


pari o con l’insieme di tutte le frazioni 
(si veda la figura qui sotto). Questi due 
esempi mettono in evidenza una pro¬ 
prietà paradossale degli insiemi infiniti: 
un insieme infinito può essere equipo- 
tente con uno dei suoi sottoinsiemi, e 
anzi si dimostra facilmente che un in¬ 
sieme è infinito se, e solo se, è equipo- 
tente con un suo sottoinsieme proprio. 

Tutto ciò era molto stimolante, ma 
non soddisfacente per Cantor: la no¬ 
zione di cardinalità per insiemi infiniti 
sarebbe stata interessante solo se fosse 
stato possibile dimostrare che non tutti 
gli insiemi infiniti hanno la stessa car¬ 
dinalità. E fu proprio questa la prima 
grande scoperta di Cantor nella teoria 
degli insiemi: con una dimostrazione 
basata sul suo famoso metodo diago¬ 
nale egli riuscì a dimostrare che l’insie¬ 
me dei numeri naturali non è equipo- 
tente con l’insieme dei punti di un seg¬ 
mento (si veda l’illustrazione nella pa¬ 
gina seguente). 

Esistono quindi almeno due tipi di¬ 
versi di infinità. Il primo tipo, l’infinità 
dei numeri naturali (e di ogni insieme 
infinito equipotente), viene detta aleph 
con zero (N 0 ) e gli insiemi aventi 
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Un insieme si dice numerabile se può essere posto in corrispon¬ 
denza biunivoca con i numeri naturali (successione al centro). 
Cosi, l’insieme di tutti i numeri pari (successione in alto ) è 
numerabile e tale risulta anche l’insieme di tutte le frazioni 
(successione in basso). Il metodo qui mostrato è quello usa¬ 
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to dal matematico G. Cantor (1845-1918); le frazioni non sono di¬ 
sposte in ordine di grandezza naturale, ma in un ordine determina¬ 
to dalla somma del numeratore e del denominatore. Entrambi que¬ 
sti esempi mostrano che gli insiemi infiniti, a differenza di quelli 
finiti, possono essere equipotenti con uno dei propri sottoinsiemi. 
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1 . 0 , 1834798463900 ... 

2 . 0 , 3694857011092 ... 

3 . 0 , 5047220017399 ... 

4 . 0 , 9980123010948 ... 

5 . 0 , 0010230549761 ... 

6 . 0 , 5154679837123 ... 

7 . 0 , 5511987135042 ... 

i : 

L insieme dei numeri reali non è numerabile, come Cantor dimoslrò col suo famoso 
metodo diagonale. Qui è elencato un campione casuale di elementi di tale insieme 
espressi in forma decimale. Se si prende la prima cifra decimale del primo numero, la 
seconda cifra del secondo numero e cosi via (cifre in colore ) si ottiene un numero reale 
la cui espressione decimale infinita è 0,1640277 ... Se in questa espressione si cambia 
a caso ogni cifra, si da ottenere ad esempio il numero 0,2751388..., basta un mo¬ 
mento di riflessione per accorgersi che questo nuovo numero differisce per almeno 
una cifra da ogni numero elencato in precedenza. Quindi questo nuovo numero risulta 
non figurare nel nostro elenco iniziale che in questo modo si dimostra essere incompleto. 


cardinalità K 0 vengono detti nume¬ 
rabili. Il secondo tipo di infinità è quel¬ 
lo rappresentato da tutti i punti di un 
segmento e la sua cardinalità viene in¬ 
dicata con una c gotica minuscola ( c ) 
che sta per « continuo ». Ogni segmen¬ 
to, di qualunque lunghezza, ha cardinali¬ 
tà C. (si veda la figura della pagina a fron¬ 
te). La stessa cardinalità ha ogni rettan- 
gologolo nel piano, ogni cubo nello spa¬ 
zio e in generale ogni spazio illimitato 
a n dimensioni, comunque grande sia n. 

JT atto il primo passo sulla strada degli 
infiniti, il successivo segue in modo 
naturale. Consideriamo il concetto di 
insieme di tutti i sottoinsiemi di un insie¬ 
me dato (si veda la figura a pagina 
28). Se indichiamo con A l’insieme 
di partenza, questo nuovo insieme vie¬ 
ne detto insieme potenza di A e indi¬ 
cato con 2 A . E proprio come a partire 
da A otteniamo il suo insieme potenza 
2 A , cosi da 2 A possiamo ottenere con 
un ulteriore passo 2 i2A> e cosi via. 

Cantor dimostrò che tanto per A fi¬ 
nito quanto per A infinito, 2 A non è 
mai equipotente con A, sicché l’opera¬ 
zione di formare l’insieme di tutti i sot¬ 
toinsiemi genera una catena senza fine 
di insiemi infiniti crescenti e non equi- 
potenti. In particolare, se A è l’insieme 


dei numeri naturali è facile dimostrare 
che 2 A (l’insieme di tutti gli insiemi di 
numeri naturali) è equipotente col con¬ 
tinuo (l’insieme di tutti i punti di un 
segmento). In simboli, 

2 N o = c. 

A questo punto il lettore si chiederà: 
esiste un insieme infinito la cui cardi¬ 
nalità sia compresa fra N 0 e c? Esi¬ 
ste cioè su un segmento un insieme infi¬ 
nito di punti che non è equipotente con 
l’intero segmento né con l’insieme dei 
numeri naturali? 

La questione si presentò a Cantor il 
quale però non riusci a trovare un in¬ 
sieme con tali caratteristiche; egli ne 
concluse - o meglio suppose — che 
un insieme di questo tipo non esiste. A 
questa ipotesi di Cantor venne dato il 
nome di « ipotesi del continuo » e il 
problema della sua dimostrazione o re- 
futazione figurava come primo in una 
celebre lista di problemi matematici non 
risolti presentata da David Hilbert nel 
1900. La questione è stata finalmente 
risolta nel 1963, ma probabilmente in 
un senso completamente diverso da 
quello immaginato da Hilbert. 

Per affrontare il problema non ci si 
può fondare più sulla definizione can- 


toriana di insieme come « ogni colle¬ 
zione in un tutto di oggetti separati e 
distinti della nostra intuizione o del no¬ 
stro pensiero », dal momento che que¬ 
sta definizione, apparentemente cosi na¬ 
turale e trasparente, nasconde alcune 
trappole veramente perfide, come dimo¬ 
stra la brutta esperienza fatta da Gott¬ 
lob Frege nel 1902. Frege stava per 
pubblicare il secondo volume della sua 
opera principale nella quale esponeva 
una ricostruzione dell’aritmetica in ter¬ 
mini di teoria degli insiemi, ossia fon¬ 
dandosi sulla teoria « intuitiva » degli 
insiemi come allora era nota sulla ba¬ 
se dei lavori di Cantor, quando ricevet¬ 
te una lettera dal giovane Bertrand Rus¬ 
sell che pubblicò aggiungendo al suo 
volume una appendice che inizia con le 
seguenti parole: « A uno scrittore di 
scienza ben poco può giungere piu sgra¬ 
dito del fatto che, dopo completato un 
lavoro, venga scosso uno dei fonda¬ 
menti della sua costruzione. Sono stato 
messo in questa situazione da una let¬ 
tera del signor Bertrand Russell, quan¬ 
do la stampa di questo volume stava 
per essere finita ». 

La « scossa » data da Russell consiste¬ 
va nel mettere in evidenza un semplice 
paradosso. Esistono due tipi di insiemi. 
Di un primo tipo sono quelli, ad esempio 
lo « insieme di tutti gli oggetti descrivibili 
con esattamente dodici parole ita¬ 
liane », che godono della proprietà ca¬ 
ratteristica di soddisfare essi stessi alla 
proprietà che li definisce; in altri ter¬ 
mini, insiemi che contengono se stessi 
come elementi. Dal nome di Russell, li 
chiameremo insiemi-??. Esistono poi 
tutti gli altri insiemi, ossia quegli insie¬ 
mi che non appartengono a se stessi: 
chiamiamoli insiemi-non R. Ora, dice 
Russell, consideriamo la collezione di 
tutti gli insiemi-non R (il termine « col¬ 
lezione » viene qui introdotto come si¬ 
nonimo conveniente per « insieme »), 
e chiamiamo AL questa collezione. Al¬ 
lora AL è un insieme-?? o un insieme- 
-non R. Ma se AL è un insieme-non R 
esso appartiene a AL per la stessa defi¬ 
nizione di AL e allora è un insieme-?? 
per la definizione di insieme-??: otte¬ 
niamo cioè una contraddizione. Se vi¬ 
ceversa M è un insieme-??, allora, per 
la definizione di AL, esso non appartiene 
a AL, ossia non appartiene a se stesso, 
ossia non è un insieme-??, ossia è un 
insieme-non R: otteniamo ancora una 
contraddizione. 

Morale: l’impiego incondizionato del¬ 
la nozione intuitiva cantoriana di insie¬ 
me può condurre a contraddizione. La 
teoria degli insiemi può costituire un 
sicuro fondamento per la matematica 
solo se si adotta una tecnica più raffi¬ 
nata, che ci assicuri di non incorrere in 
antinomie, come furono successiva- 
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mente chiamate le contraddizioni del 
tipo di quella scoperta da Russell. 

j^on era del resto la prima volta che 
sgraditi paradossi si insinuavano in 
teorie matematiche apparentemente per¬ 
fette. I paradossi di Zenone, ad esem¬ 
pio, avevano rivelato ai Greci com¬ 
plessità insospettate nei concetti intui¬ 
tivi di retta e punto. Possiamo rile¬ 
vare un’analogia: come Russell aveva 
riscontrato una contraddizione nell’im¬ 
piego del concetto intuitivo di insieme, 
cosi Zenone aveva trovato una contrad¬ 
dizione nell’impiego incondizionato dei 
concetti intuitivi di «retta» e «punto». 

Ai suoi inizi, con Talete nel VI seco¬ 
lo a.C., la geometria greca si era fon¬ 
data su un concetto intuitivo e non spe¬ 
cificato di « retta » e « punto ». Circa 
tre secoli più tardi Euclide aveva dato 
una sistemazione assiomatica a questi 
concetti. Per Euclide gli oggetti geome¬ 
trici erano ancora enti reali intuitiva¬ 
mente noti, ma nella misura in cui di¬ 
venivano soggetti di un ragionamento 
geometrico essi venivano specificati sul¬ 
la base di date proposizioni assunte sen¬ 
za dimostrazione (gli « assiomi » e i 
« postulati ») a partire dalle quali tutte 
le loro altre proprietà si sarebbero po¬ 
tute dimostrare come « teoremi ». Non 
sappiamo se, e in che misura, questa 
sistemazione era motivata dall’esigenza 
di superare i paradossi di tipo zenonia- 
no; è indubbio tuttavia che la geome¬ 
tria greca venne resa molto più sicura 
da questa sistemazione che la faceva 
dipendere (almeno cosi credevano e in¬ 
tendevano i geometri greci) solo dal¬ 
l’inferenza logica da un piccolo nume¬ 
ro di assunzioni esplicitamente enun¬ 
ciate. 

Uno sviluppo analogo per la teoria 
degli insiemi ha richiesto, invece di 
300 anni, solo 35. Se Cantor si può qui 
avvicinare a Talete — il fondatore 
della teoria, che si affidava a soli ragio¬ 
namenti intuitivi - allora la funzione 
svolta da Euclide viene assunta da Ernst 


Zermelo che nel 1908 fondò la teoria 
assiomatica degli insiemi. Ovviamente, 
Euclide fu in realtà soltanto un elemen¬ 
to di una lunga successione di geome¬ 
tri greci che crearono la « geometria 
euclidea »; analogamente, Zermelo fu 
solo il primo di una mezza dozzina di 
grandi nomi legati alla creazione della 
teoria assiomatica degli insiemi. 

Proprio come Euclide aveva elenca¬ 
to certe proprietà determinate di rette e 
punti e aveva considerato come dimo¬ 
strati solo quei teoremi geometrici che 
potevano essere ottenuti da questi as¬ 
siomi (e non da ogni possibile ragiona¬ 
mento intuitivo) così nella teoria assio¬ 
matica degli insiemi un insieme viene 
riguardato semplicemente come un og¬ 
getto non definito che soddisfa un dato 
elenco di assiomi. Naturalmente, noi 
vogliamo pur sempre studiare insiemi 
(o rette, ad esempio) e quindi gli as¬ 
siomi non vengono scelti arbitraria¬ 
mente ma secondo la nostra nozione in¬ 
tuitiva di insieme o di retta; l’intuizio¬ 
ne cessa tuttavia di avere qualunque 
funzione sul piano formale: noi accet¬ 
tiamo solo quelle proposizioni che de¬ 
rivano dagli assiomi. Il fatto che gli 
oggetti descritti da questi assiomi esi¬ 
stano nel mondo reale è irrilevante per 
il processo della deduzione formale 
(malgrado sia essenziale per la sco¬ 
perta). 

Noi conveniamo di comportarci co¬ 
me se i simboli per « retta », « pun¬ 
to » e « angolo » in geometria, o i sim¬ 
boli per « insieme », « è un sottoinsie¬ 
me di », ecc. nella teoria degli insiemi, 
siano dei puri segni sulla carta, che pos¬ 
sono essere manipolati solo in confor¬ 
mità con un dato sistema di regole (as¬ 
siomi e regole di inferenza). Sono ac¬ 
cettati come teoremi solo quelle pro¬ 
posizioni che si ottengono in confor¬ 
mità a tali manipolazioni di simboli (in 
pratica sono accettate solo quelle pro¬ 
posizioni che evidentemente potrebbe¬ 
ro essere ottenute in questo modo se 
si avesse tempo e voglia di farlo). 


Qra, nella storia della geometria un 
postulato ha avuto una parte del 
tutto particolare; si tratta del postulato 
della parallela, il quale afferma che in 
un piano, per un punto dato, può es¬ 
sere condotta soltanto una retta paral¬ 
lela a una retta data. La difficoltà rela¬ 
tiva all’assumere questa proposizione 
come assioma è data dal fatto che essa 
non ha quel chiaro carattere di eviden¬ 
za che si vorrebbe riscontrare negli ele¬ 
menti fondamentali di una teoria ma¬ 
tematica. E, in effetti, due rette paral¬ 
lele sono definite come quelle rette che 
non si incontrano mai anche se prolun¬ 
gate indefinitamente (« all’infinito »); 
poiché ogni retta che noi possiamo trac¬ 
ciare su un foglio di carta o sulla la¬ 
vagna ha lunghezza finita, questo è un 
assioma che per sua natura non può 
essere verificato da una diretta osser¬ 
vazione sensibile: nondimeno, esso è 
indispensabile nella geometria euclidea. 
Per molti secoli un problema fonda- 
mentale in geometria fu proprio quel¬ 
lo di dimostrare il postulato della pa¬ 
rallela, per stabilire che esso poteva es¬ 
sere ottenuto come teorema dagli as¬ 
siomi euclidei più evidenti. 

Anche nella teoria astratta degli in¬ 
siemi c’era un assioma che alcuni ma¬ 
tematici trovavano difficile ingoiare; era 
l’assioma di scelta, che afferma quanto 
segue: se a è una qualunque collezione 
di insiemi {A, B, . . .} e nessuno degli 
insiemi di a è vuoto, allora esiste un 
insieme Z che contiene esattamente un 
elemento di A, un elemento di B, e 
così via per tutti gli insiemi di a. Se, 
ad esempio, a consiste di due insiemi, 
l’insieme di tutti i triangoli e l’insieme 
di tutti i quadrati, allora si soddisfa in 
modo evidente all’assioma di scelta: ba¬ 
sta semplicemente scegliere un partico¬ 
lare triangolo e un particolare quadra¬ 
to e con questi due elementi costituire 
l’insieme Z. 

La maggior parte dei matematici ri¬ 
tiene che l’assioma di scelta, come il 
postulato della parallela, sia intuitiva- 
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Si può dimostrare che vi è corrispondenza biunivoca anche fra 
una retta infinita e un segmento. P è il centro di una semicircon¬ 
ferenza S tangente a una retta L. Una semiretta da P incontra S 
in un solo punto, sicché le semirette da P forniscono un’asso¬ 


ciazione biunivoca fra punti di S e punti di L. Al variare della 
direzione della semiretta, non viene omesso alcun punto, né di 
S né di I. Cosi fra i punti di una retta infinita e i punti di un 
segmento di lunghezza arbitraria esiste corrispondenza biunivoca. 
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Esemplificazione. del concetto di insieme di tutti i sottoinsiemi di un insieme dato. 
Il quadrato, il triangolo e il cerchio costituiscono l’insieme A di tre elementi (in alto). 
Questo insieme ha 2 3 sottoinsiemi, ossia 8 sottoinsiemi, una volta che si convenga di 
considerare tali, anche se impropriamente, l’insieme vuoto e l’intero insieme iniziale A. 
Questo nuovo insieme formato da 8 elementi viene detto insieme potenza di A e deno¬ 
tato col simbolo 2 A . Se A ha n elementi, l’insieme potenza di A ha 2" elementi. Se 
A è infinito, anche 2 A è infinito e non è equipotente con l’insieme A di partenza. 


mente plausibile. Le difficoltà nel no¬ 
stro caso sorgono daH’ammettere per a 
« qualunque » collezione di insiemi. 
Come abbiamo visto, esistono catene 
senza fine di insiemi infiniti sempre più 
grandi; per una tale collezione incon¬ 
cepibilmente enorme di insiemi non c’è 
alcun modo di operare effettivamente 
una scelta da ognuno dei suoi insiemi 
membri. Se noi accettiamo l’assioma di 
scelta, ciò significa semplicemente che 
noi accettiamo come atto di fede che 
tale scelta è possibile, proprio come 
l’accettazione del postulato della paral¬ 
lela significa fare un atto di fede sul 
comportamento delle rette all’infinito. 
Ne viene che dall’apparentemente in¬ 
nocuo assioma di scelta derivano alcu¬ 
ne conclusioni del tutto inattese ed 
estremamente potenti. Ad esempio, pos¬ 
siamo usare il ragionamento induttivo 
per dimostrare proposizioni sugli ele¬ 
menti di ogni insieme, praticamente nel¬ 
lo stesso modo con cui l’induzione ma¬ 
tematica può essere usata per provare 
teoremi sui numeri naturali 1, 2, 3, ecc. 

L’assioma di scelta assolve a una 
funzione del tutto particolare nella teo¬ 
ria degli insiemi e molti matematici ri¬ 
tengono che il suo impiego dovrebbe 
essere evitato ogniqualvolta è possibile. 
Una teoria assiomatica degli insiemi 
ove non si assume l’assioma di scelta 
come vero o come falso sarebbe una 


teoria che riscuoterebbe la fiducia della 
maggior parte dei matematici. Nel se¬ 
guito useremo la dizione « teoria ri¬ 
stretta degli insiemi » per un sistema 
assiomatico di questo tipo, mentre con 
« teoria standard degli insiemi » inten¬ 
deremo la teoria basata sull’intero si¬ 
stema di assiomi elaborato da Zermelo 
e Abraham Fraenkel: teoria ristretta 
degli insiemi più assioma di scelta. 

jV uova luce sull’argomento fu gettata 
nel 1938 da Kurt Godei. Godei è 
meglio noto per i suoi grandi teoremi 
di «incompletezza» del 1930-1931, 
ma qui noi ci riferiamo a un suo lavoro 
successivo poco noto ai non matemati¬ 
ci. Nel 1938 Godei dimostrò il seguen¬ 
te fondamentale risultato: se la teoria 
ristretta degli insiemi è consistente, al¬ 
lora è tale anche la teoria standard de¬ 
gli insiemi. In altre parole, l’assioma di 
scelta non è più pericoloso degli altri 
assiomi; se nella teoria standard può 
essere scoperta una contraddizione, al¬ 
lora una contraddizione deve già tro¬ 
varsi nell’ambito della teoria ristretta 
degli insiemi. 

Ma Godei non dimostrò solo questo. 
Ricordiamo al lettore la « ipotesi del 
continuo » di Cantor, l’ipotesi cioè che 
non esiste alcun cardinale infinito che 
è maggiore di R 0 e minore di c. 
Godei dimostrò anche che possiamo as¬ 


sumere senza danni l’ipotesi del conti¬ 
nuo come ulteriore assioma della teoria 
degli insiemi; in altri termini, se la teo¬ 
ria ristretta degli insiemi con raggiun¬ 
ta dell’ipotesi del continuo implica una 
contraddizione, allora, anche in questo 
caso, deve essere presente una contrad¬ 
dizione già all’interno della teoria ri¬ 
stretta degli insiemi. Questa era una so¬ 
luzione parziale del problema di Can¬ 
tor: non era una dimostrazione dell’ipo¬ 
tesi del continuo, ma solo del fatto che 
essa non può essere refutata (ossia che 
non può essere dimostrata la sua nega¬ 
zione). 

Per comprendere come Godei potè 
ottenere questo risultato, dobbiamo ca¬ 
pire che cosa si intende per modello di 
un sistema di assiomi. Ritorniamo per 
un momento agli assiomi della geome¬ 
tria piana. Se prendiamo questi assio¬ 
mi, incluso il postulato della parallela, 
abbiamo gli assiomi della geometria 
euclidea; se invece prendiamo tutti gli 
assiomi precedenti ma al posto del po¬ 
stulato della parallela assumiamo la sua 
negazione, otteniamo gli assiomi di una 
geometria non euclidea. Per entrambi 
questi sistemi di assiomi (euclideo e 
non euclideo) chiediamo: possono que¬ 
sti assiomi condurre a una contraddi¬ 
zione? 

Può sembrare del tutto irragionevo¬ 
le porre la questione per il sistema eu¬ 
clideo: come può esserci qualcosa di 
sbagliato nella nostra geometria licea¬ 
le, vecchia di oltre 2000 anni? D’altra 
parte il non matematico è certamente 
in un atteggiamento alquanto sospetto¬ 
so nei riguardi del secondo sistema d’as¬ 
siomi, che contiene la negazione del 
postulato della parallela, intuitivamente 
pur sempre plausibile. Dal punto di vi¬ 
sta della matematica del XX secolo pe¬ 
rò, i due tipi di geometria stanno più 
o meno nella stessa posizione: sono en¬ 
trambi applicabili, in date circostanze, 
al mondo fisico, e entrambi sono consi¬ 
stenti in un senso relativo che ora spie¬ 
gheremo. 

Mostriamo dapprima che la geome¬ 
tria non euclidea è consistente. Per far 
questo, sostituiamo la parola « retta », 
ovunque essa figura, con l’espressione 
« circonferenza massima » (la curva 
formata sulla superficie di una sfera da 
un piano passante per il suo centro). 
Riguardiamo ora gli assiomi come pro¬ 
posizioni sui punti e le circonferenze 
massime di una data sfera; inoltre con¬ 
veniamo di identificare in un unico 
punto ogni coppia di punti diametral¬ 
mente opposti sulla sfera. Se il lettore 
preferisce, può immaginare gli assiomi 
della geometria non euclidea trascritti, 
con la parola « retta » ovunque sosti¬ 
tuita da « circonferenza massima » e la 
parola « punto » ovunque sostituita da 
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« coppia di punti (diametralmente op¬ 
posti) ». È allora evidente che tutti gli 
assiomi sono veri, almeno nella misura 
in cui sono vere le nostre ordinarie in¬ 
tuizioni e nozioni sulla superficie di 
una sfera. In effetti, dagli assiomi della 
geometria euclidea solida si può dimo¬ 
strare facilmente che la superficie di 
una sfera è una superficie non euclidea 
nel senso che abbiamo descritto. In al¬ 
tre parole vediamo ora che se gli assio¬ 
mi della geometria non euclidea con¬ 
ducono a una contraddizione, allora 
anche l’ordinaria geometria euclidea 
della sfera condurrebbe a una contrad¬ 
dizione. Abbiamo quindi una dimostra¬ 
zione relativa di consistenza: se la geo¬ 
metria euclidea tridimensionale è con¬ 
sistente, è tale anche la geometria non 
euclidea bidimensionale. Diciamo che 
la superficie della sfera euclidea è un 
modello per gli assiomi della geome¬ 
tria non euclidea. (Nel particolare mo¬ 
dello che abbiamo usato il postulato 
della parallela non è soddisfatto perché 
non esistono « rette » parallele. È an¬ 
che possibile costruire una superficie, la 
« pseudosfera », per la quale il postu¬ 
lato della parallela è falso perché per 
un punto passa più di una « retta » pa¬ 
rallela e una « retta » data). 

La scoperta della geometria non eu¬ 
clidea e il riconoscimento del fatto che 
la sua consistenza è implicata dalla 
consistenza della geometria euclidea è 
dovuto all’opera congiunta di numero¬ 
si grandi matematici del XIX secolo; 
ci limitiamo qui a ricordare, in parti¬ 
colare il nome di Bernhard Riemann. 
Solo nel XX secolo è stata sollevata la 
questione della consistenza della stessa 
geometria euclidea. 

Q uesto problema fu sollevato da Da¬ 
vid Hilbert il quale ne diede anche 
la soluzione, che era una semplice ap¬ 
plicazione del concetto di sistema di ri¬ 
ferimento cartesiano. Come è noto, a 
ogni punto del piano possiamo asso¬ 
ciare una coppia di numeri: la sua ascis¬ 
sa x e la sua ordinata y. A ogni retta 
o circonferenza possiamo allora asso¬ 
ciare un’equazione, ossia una relazione 
fra le coordinate x e y, che è verificata 
solo dai punti che giacciono sulla retta 
o sulla circonferenza. Si stabilisce cosi 
una corrispondenza fra geometria e al¬ 
gebra elementare: per ogni proposizio¬ 
ne espressa in uno dei due campi esiste 
una corrispondente proposizione nel¬ 
l’altro. Ne segue che gli assiomi della 
geometria euclidea possono condurre a 
una contraddizione solo se le regole del¬ 
l’algebra elementare - le proprietà de¬ 
gli ordinari numeri reali - possono 
condurre a una contraddizione. Anche 
in questo caso abbiamo una dimostra¬ 
zione relativa di consistenza. La geo¬ 


metria non euclidea era consistente se 
lo era la geometria euclidea; ora, la 
geometria euclidea è consistente solo 
se lo è l’algebra elementare. La sfera 
euclidea era un modello per il piano 
non euclideo, l’insieme di coppie di 
coordinate è a sua volta un modello 
per il piano euclideo. 

Tenendo presenti questi esempi, pos¬ 
siamo dire che la dimostrazione di Go¬ 
dei della consistenza relativa dell’assio¬ 
ma di scelta e dell’ipotesi del continuo 
è analoga alla dimostrazione di Hilbert 
della consistenza relativa della geome¬ 
tria euclidea: in entrambi gli esempi la 
teoria standard veniva giustificata in 


termini di una teoria più elementare. 
Ovviamente, nessuno aveva mai dubi¬ 
tato seriamente della sicurezza della 
geometria euclidea, mentre eminenti 
matematici come L.EJ. Brouwer, Her¬ 
mann Weyl e Henri Poincaré sollevava¬ 
no grossi dubbi circa l’assioma di scel¬ 
ta. In questo senso il risultato di Godei 
ebbe una portata e un significato ben 
maggiori. 

Una evoluzione analoga a quella del¬ 
la geometria non euclidea — che po¬ 
tremmo chiamare la teoria non canto- 
riana degli insiemi — si è avuta solo 
dal 1963 in un lavoro di uno degli e- 
stensori di questo articolo (Cohen). Co- 
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GENERALE 





Il paradosso di Russell viene illustrato supponendo che i bibliotecari siano soliti sche¬ 
dare i loro libri non servendosi di schede ma usando un catalogo a fogli staccabili, in 
modo cioè che anche il catalogo sia un libro. Alcuni bibliotecari elencano il catalogo 
stesso nel catalogo (in alto ) altri invece no (seconda riga dall’alto). Il primo tipo di 
cataloghi viene detto, dal nome di Russell, un insieme-R: gli insiemi-R sono insiemi 
che contengono se stessi. Ma cosa accade se il direttore centrale delle biblioteche 
decide di fare un catalogo generale di tutti i cataloghi che non elencano se stessi? Il 
catalogo che ne risulta deve essere compreso in questo catalogo generale oppure no? 
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«NOZIONI COMUNI» 


1. Cose uguali a una stessa altra cosa 
sono tra loro uguali. 

2. Se a cose uguali si aggiungono cose 
uguali si ottengono cose uguali. 

3. Se da cose uguali si tolgono cose u- 
guali si ottengono cose uguali. 

4. Cose che coincidono con un’altra sono 
tra loro uguali. 

5. Il tutto è maggiore della parte. 


« POSTULATI » 


Si richiede: 

1. Che da ogni punto ad ogni altro punto 
sia possibile condurre una linea retta. 

2. Che un segmento di linea retta possa 
essere indefinitamente prolungato in linea 
retta. 

3. Che attorno a un centro scelto a pia¬ 
cere con un raggio scelto a piacere sia 
possibile tracciare una circonferenza. 

4. Che tutti gli angoli retti siano tra 
loro uguali. 

5. Che se una retta, intersecando al¬ 
tre due rette, forma con esse angoli in¬ 
terni da una medesima parte la cui somma 
sia minore di due angoli retti, allora que¬ 
ste due rette indefinitamente prolungate 
finiscano con rincontrarsi da quella parte 
nella quale gli angoli interni formano me¬ 
no di due retti. 


Gli assiomi di Euclide erano di due tipi: 
«nozioni comuni» e «postulati». Il fisi¬ 
co e matematico scozzese John Playfair 
(1748-1819) ha legato il suo nome a un 
assioma che si dimostra essere equivalen¬ 
te al quinto postulato di Euclide: in un 
piano, per un punto A non giacente su 
una data retta m passa una retta che non 
interseca m. Si ottiene una geometria non 
euclidea sostituendo «una» con «nessu¬ 
na » oppure con « più d’una ». Va notato 
che gli assiomi di Euclide non sono chiari 
o completi per le nostre esigenze moderne. 


sa si intende per « teoria non cantoria- 
na degli insiemi »? Proprio come la geo¬ 
metria euclidea e quella non euclidea 
si fondavano sugli stessi assiomi con 
l’unica eccezione del postulato della pa¬ 
rallela, cosi la teoria standard (« canto- 
riana ») e quella non standard (« non 
cantoriana ») degli insiemi differiscono 
in un solo assioma. La teoria non can¬ 
toriana degli insiemi assume gli assiomi 
della teoria ristretta degli insiemi e non 
assume l’assioma di scelta bensì una 
delle possibili forme di negazione del¬ 
l’assioma di scelta. In particolare pos¬ 
siamo assumere come assioma la nega¬ 
zione dell’ipotesi del continuo. Quindi, 
come spiegheremo piu avanti, dispo¬ 
niamo ora di una soluzione completa 
del problema del continuo : alla scoper¬ 
ta, compiuta da Godei, che l’ipotesi del 
continuo non è refutabile si è ora ag¬ 
giunto il fatto che essa non è neppure 
dimostrabile. 


Tanto il risultato di Godei quanto 
quello più recente di Cohen richiedono 
la costruzione di un modello, analoga¬ 
mente a quanto accadeva per le dimo¬ 
strazioni di consistenza della geometria 
che abbiamo descritto sopra. In entram¬ 
bi i casi intendiamo dimostrare che se 
la teoria ristretta degli insiemi è consi¬ 
stente, è tale anche la teoria standard 
degli insiemi (o la teoria non standard). 

L’idea di Godei fu quella di costruire 
un modello per la teoria ristretta degli in¬ 
siemi e di dimostrare che in questo mo¬ 
dello l’assioma di scelta e l’ipotesi del 
continuo sono teoremi. Il suo procedi¬ 
mento è il seguente. Usando solo gli as¬ 
siomi della teoria ristretta degli insiemi 
(si veda la figura nella pagina a fronte) 
siamo intanto garantiti, per l'assioma 2, 
dell’esistenza di almeno un insieme (l’in¬ 
sieme vuoto); gli assiomi 3 e 4 ci ga¬ 
rantiscono allora dell’esistenza di una 
successione infinita di insiemi finiti sem¬ 
pre più grandi; quindi l’assioma 5 ci 
garantisce 1’esistenza di un insieme in¬ 
finito; ancora l’assioma 7 ci assicura 
dell’esistenza di una successione senza 
fine di insiemi infiniti sempre più grandi 
(non equipotenti) e così via. Sostan¬ 
zialmente per questa via Godei speci¬ 
ficò una classe di insiemi in base al mo¬ 
do col quale essi potevano effettiva¬ 
mente essere costruiti in passi succes¬ 
sivi a partire da insiemi più semplici. 
Godei chiamò questi insiemi « insiemi 
costruibili » ; la loro esistenza era ga¬ 
rantita dagli assiomi della teoria ri¬ 
stretta degli insiemi. A questo punto 
egli fece vedere che nell’ambito degli 
insiemi costruibili si potevano dimostra¬ 
re tanto l’assioma di scelta quanto l’ipo¬ 
tesi del continuo; vale a dire (1) che da 
ogni collezione costruibile a di insiemi 
costruibili (A, B, ...) si può scegliere 
un insieme costruibile Z che contiene 
almeno un elemento da ognuno degli 
A, B, ecc. Questo è l’assioma di scelta 
che ora potrebbe essere più propria¬ 
mente chiamato il teorema di scelta. E, 
(2), che se A è un insieme costruibile 
infinito, allora non esiste alcun insieme 
costruibile « fra » A e 2 A (maggiore di 
A o minore dell’insieme potenza di A 
e non equipotente con nessuno di questi 
due insiemi). Se per A si prende il pri¬ 
mo cardinale transfinito, quest’ultima 
proposizione è l’ipotesi del continuo. 

el caso della teoria costruibile degli 
insiemi venne quindi dimostrata 
un’« ipotesi generalizzata del conti¬ 
nuo ». Il lavoro di Godei avrebbe quin¬ 
di risolto completamente questi due 
problemi se fossimo disposti ad assu¬ 
mere l’assioma che esistono solo insiemi 
costruibili. Perché non lo facciamo? 
Perché non ci sembra ragionevole so¬ 
stenere che un insieme debba essere 


costruito in conformità con una qua¬ 
lunque formula prescritta per ricono¬ 
scerlo come un vero e proprio insieme. 
Così nell’ordinaria teoria degli insiemi 
(non necessariamente costruibili) non 
sono stati dimostrati né l’assioma di 
scelta né l’ipotesi del continuo. Almeno 
di questo si era certi: ognuno di essi 
poteva essere assunto senza pericolo di 
contraddizione a meno che gli assiomi 
« sicuri » della teoria ristretta degli in¬ 
siemi non fossero già di per sé contrad¬ 
dittori; qualunque contraddizione essi 
causino deve essere già presente nella 
teoria costruibile degli insiemi che è un 
modello per la teoria degli insiemi or¬ 
dinaria. In altre parole, si sapeva che 
nessuno di essi poteva essere refutato a 
partire dagli altri assiomi ma non si 
sapeva se essi potevano essere dimo¬ 
strati oppure no. 

Qui l’analogia col postulato della pa¬ 
rallela della geometria euclidea diviene 
particolarmente stretta. Fino a un’epoca 
molto recente si assumeva per certo che 
gli assiomi di Euclide fossero consisten¬ 
ti; la questione che interessava i geome¬ 
tri era se essi fossero o no indipendenti, 
ossia se il postulato della parallela po¬ 
tesse venir dimostrato a partire dagli 
altri. Intere generazioni di geometri 
tentarono di dimostrare il postulato del¬ 
la parallela mostrando che la sua ne¬ 
gazione conduce a delle assurdità. Sem¬ 
bra che il primo a rendersi conto che 
queste « assurdità » altro non erano che 
teoremi di una nuova geometria non 
euclidea sia stato Karl Friedrich Gauss, 
il quale però se pure ebbe il coraggio 
di pensare queste cose non ebbe il co¬ 
raggio di pubblicarle. Toccò così a Jà- 
nos Bolyai, Nikolai Ivanovic Loba- 
cevskij e Riemann trarre le conseguen¬ 
ze logiche che derivavano dal negare 
il postulato della parallela. Queste con¬ 
seguenze erano la scoperta di geome¬ 
trie « fantastiche » che erano altrettan¬ 
to consistenti della geometria euclidea 
del « mondo reale ». Solo dopo molto 
tempo si riconobbe che la geometria 
non euclidea bidimensionale era esatta¬ 
mente l’ordinaria geometria euclidea di 
certe superfici curve (sfere e pseudo¬ 
sfere). 

Il passo analogo nella teoria degli 
insiemi sarebbe quello di negare l’as¬ 
sioma di scelta o l’ipotesi del continuo. 
Con ciò ovviamente intendiamo dire 
che il passo consisterebbe nel dimostra¬ 
re che tale negazione è consistente con 
la teoria ristretta degli insiemi nello 
stesso senso in cui Godei ha dimostrato 
che l’affermazione corrispondente è 
consistente. È appunto questa dimostra¬ 
zione che è stata ottenuta nel 1963 e 
che ha dato origine a tutta una serie 
di ricerche in logica matematica, di cui 
non è possibile ancora prevedere quali 
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1. ASSIOMA DI ESTENSIONALITÀ 

Vx, y (Vz (zex-<-zey) x = y). 

Due insiemi sono uguali se e solo se hanno gii stessi elementi. 


2. ASSIOMA DELL’INSIEME VUOTO 

3x Vy (~yex). 

Esiste un insieme che non ha elementi (l'insieme vuoto). 


3. ASSIOMA DELL’INSIEME COPPIA 

Vx, y 3z Vw (wez<->w = xVw = y). 

Se x e y sono insiemi, allora la coppia (non ordinata) (x, y} è un insieme. 


4. ASSIOMA DELL’INSIEME RIUNIONE 

Vx 3yVz (zey<->3t (zet&tex) ). . , 

Se x è un insieme di insiemi, la riunione di tutti i suoi membri è un insieme. (Ad esempio, se x = 1 {a, b, c } , {a, c, d, e}> allora la 

riunione dei due elementi di x è l'insieme {a, b, c, d, e }. ) 1 


5. ASSIOMA DELL'INFINITO 

3x (<J>ex & Vy (yex-i-y U (y}ex). 

Esiste un insieme x che contiene l'insieme vuoto ed è tale che se y appartiene a x, allora anche la riunione di y e jyj è in x. è fonda- 
mentale la distinzione fra l'elemento y e l’insieme {y} che contiene y come unico elemento. Questo assioma assicura l'esistenza di insiemi 

infiniti. 


6„. ASSIOMA DI RIMPIAZZAMENE) ; > 

Vt|.tk (Vx 3! y A n (x,y;ti. L) —Vu 3v B(u,v) ) dove B(u,v) 3 Vr (rev*->3s (seu & A n (s,r;ti. th) ) )• 

È difficile enunciare questo assioma in linguaggio comune. È stato numerato 6„ invece di 6, perché in realtà è uno schema di assiomi, ossia 
un'intera famiglia di assiomi. Supponiamo di aver enumerato tutte le formule esprimibili nel nostro sistema e indichiamo con A,, l'n-esima 
di tali formule. Allora l'assioma di rimpiazzamento dice che, se per dati ti, . . ., tk, A„ (x, y; fi) definisce univocamente y come funzione di 
x, diciamo y = <p(x) allora, per ogni u, il codominio di <p su u è un insieme. Parlando in termini alquanto approssimativi, ciò significa 
che ogni proprietà («ragionevole») che può essere enunciata dal linguaggio formale della teoria può essere usata per definire un insieme 

(l'insieme delle cose che godono della proprietà enunciata). 


7. ASSIOMA DELL'INSIEME POTENZA 

Vx 3y Vz (zey<->z s x). 

Questo assioma afferma che esiste, per ogni x, l'insieme y di tutti i sottoinsiemi di x. Malgrado y venga cosi definito mediante una pro¬ 
prietà, esso non è ottenibile dalt'assioma di rimpiazzamento perché non è dato come codominio di una funzione. In effetti, la cardinalità 
di y risulta maggiore di quella di x, sicché questo assioma ci consente di costruire cardinali superiori. 


8. ASSIOMA DI SCELTA 

Se n -A .- ct> è una funzione definita per tutti gli aex, allora esiste un'altra funzione f(a) per aex, e /( a)eA a . 

Questo è il ben noto assioma di scelta che ci permette di fare un numero infinito di «scelte» anche se non disponiamo di alcuna proprietà 
che ci permetterebbe di definire la funzione di scelta consentendoci cosi di usare al suo posto l'assioma 6». 


9. ASSIOMA DI FONDAZIONE 

Vx3y(x= tj> V (yex& Vz (zex-»~zey) ) ). 

Questo assioma esclude esplicitamente, ad esempio, xex. 


In questa tavola sono elencati gli assiomi proposti «la Ernst enunciare questi teoremi è necessario far uso dei simboli della 

Zermelo e Abraham Fraenkel per la teoria degli insiemi. Per teoria degli insiemi, un glossario dei quali è presentato in alto. 
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Sulla sfera, il termine « retta » viene inter¬ 
pretato come significante « circonferenza 
massima » (A e B in alto). Per ogni cop¬ 
pia di punti diametralmente opposti (aa’ 
e bb’) passano molte circonferenze massi¬ 
me. Se interpretiamo « punto » come si¬ 
gnificante « coppia di punti » allora i po¬ 
stulati di Euclide sono veri. Il secondo po¬ 
stulato è vero se si ammette che la « retta » 
estesa abbia lunghezza totale finita o che 
ripassi piu volte su se stessa. Anche il 
terzo postulato è vero se conveniamo che 
la distanza vada misurata lungo circonfe¬ 
renze massime che possono essere ritrac¬ 
ciate molte volte ; qui « circonferenza » 
significa l’insieme di punti sulla sfera a 
una data distanza (misurata come sopra 
abbiamo convenuto) da un dato punto. An¬ 
che il quarto postulato è vero. Il postu¬ 
lato di Playfair è invece falso perché due 
qualunque circonferenze massime si inter¬ 
secano. La sfera è quindi un modello di 
geometria non euclidea. Anche la pseudo¬ 
sfera (in basso) è un modello di geome¬ 
tria non euclidea ove si interpretino le 
rette come le più brevi curve che connet¬ 
tono due punti qualsiasi della superficie. 
Sulla superficie della pseudosfera esisto¬ 
no molte « rette » che passano per un da¬ 
to punto e non intersecano una data retta. 


possano rivelarsi gli sviluppi definitivi. 

Poiché si tratta di dimostrare la con¬ 
sistenza relativa di un sistema di assio¬ 
mi pensiamo in modo naturale alla co¬ 
struzione di un modello. Come abbia¬ 
mo visto, la consistenza relativa della 
geometria non euclidea venne stabilita 
quando si mostrò che certe superfìci 
della geometria euclidea tridimensiona¬ 
le erano modelli della geometria non 
euclidea bidimensionale. In modo del 
tutto analogo, per provare la legitti¬ 
mità di una teoria non cantoriana degli 
insiemi, nella quale l’assioma di scelta 
o l’ipotesi del continuo sono falsi, dob¬ 
biamo usare gli assiomi della teoria ri¬ 
stretta degli insiemi per costruire un 
modello nel quale la negazione dell’as¬ 
sioma di scelta o la negazione dell’ipo¬ 
tesi del continuo possono essere dimo¬ 
strate come teoremi. 

g i deve ammettere che la costruzione 
di un tale modello è una questione 
complessa e delicata. Ma questa è una 
cosa che probabilmente ci si doveva a- 
spettare. Nel caso degli insiemi costrui¬ 
bili di Godei, ossia col suo modello per 
la teoria cantoriana degli insiemi, ci si 
proponeva di creare qualcosa che coin¬ 
cidesse sostanzialmente con la nostra 
nozione intuitiva di insieme ma che fos¬ 
se più trattabile. Il nostro compito è 
invece quello di creare un modello di 
qualcosa di non intuitivo e strano, fa¬ 
cendo tuttavia uso del familiare mate¬ 
riale da costruzione fornitoci dalla teo¬ 
ria ristretta degli insiemi. 

Piuttosto che fermarci a questo pun¬ 
to affermando che è impossibile descri¬ 
vere questo modello in un articolo non 
tecnico, tenteremo almeno di dare un 
resoconto descrittivo di alcune delle 
idee guida che questo compito compor¬ 
ta. Il nostro punto di partenza è la teo¬ 
ria ordinaria degli insiemi (senza l’as¬ 
sioma di scelta). Speriamo solo di di¬ 
mostrare la consistenza della teoria non 
cantoriana degli insiemi in un senso 
relativo. Proprio come i modelli di 
geometria non euclidea provano che 
questa è consistente se lo è la geometria 
euclidea, cosi dimostreremo che se la 
teoria ristretta degli insiemi è consi¬ 
stente, essa rimane tale se aggiungiamo 
la proposizione « l’assioma di scelta è 
falso », o la proposizione « l’ipotesi del 
continuo è falsa ». Supponiamo ora di 
disporre di un modello della teoria ri¬ 
stretta degli insiemi come punto di par¬ 
tenza. Chiamiamo M questo modello, 
che può essere riguardato come la clas¬ 
se degli insiemi costruibili di Godei. 

Sappiamo dal lavoro di Godei che 
perché l’assioma di scelta o l’ipotesi del 
continuo divengano falsi dobbiamo ag¬ 
giungere almeno un insieme non co¬ 
struibile. Come ottenere ciò? Aggiun¬ 


giamo la lettera a come nome di un og¬ 
getto che vada aggiunto a M; resta da 
determinare che tipo di oggetto deve 
essere questo a. Una volta aggiunto a 
dobbiamo anche aggiungere ogni altro 
oggetto che può essere formato a par¬ 
tire da a applicando le operazioni am¬ 
messe nella teoria ristretta degli insie¬ 
mi: riunire due o più insiemi per for¬ 
mare un nuovo insieme, formare l’in¬ 
sieme potenza, e cosi via. La nuova col¬ 
lezione di insiemi cosi generata da 
M + a verrà detta N. Il problema è 
quello di come scegliere a in modo che 
1) N sia un modello per la teoria ri¬ 
stretta degli insiemi, come lo era per 
ipotesi M, e 2) a non sia costruibile in 
N. Solo se ciò è possibile ci resta una 
speranza di riuscire a negare l’assioma 
di scelta oppure l’ipotesi del continuo. 

Possiamo dare una vaga idea di co¬ 
me bisogna procedere, chiedendoci co¬ 
me avrebbe proceduto un geometra del 
1850 per scoprire la pseudosfera. In 
senso molto approssimativo, è come se 
egli fosse partito con una curva M nel 
piano euclideo, avesse immaginato un 
punto a non giacente in quel piano e 
quindi avesse congiunto il punto a a 
tutti i punti di M. Poiché a è stato 
scelto non giacente nel piano di M, la 
superfìcie N che cosi ne risulta non 
coinciderebbe sicuramente col piano eu¬ 
clideo. È quindi ragionevole pensare 
che con sufficiente ingegno e impegno 
tecnico si potrebbe mostrare che essa 
è veramente un modello per una geo¬ 
metria non euclidea. 

Il corrispondente procedimento nel 
caso della teoria non cantoriana degli 
insiemi consiste nello scegliere il nuovo 
insieme a come un insieme non costrui¬ 
bile, e quindi nel generare un nuovo 
modello N costituito da tutti gli insiemi 
ottenuti mediante le operazioni ammes¬ 
se nella teoria ristretta degli insiemi e 
applicate ad a e agli insiemi di M. Se 
questo è possibile, si sarà allora dimo¬ 
strato che si può impunemente negare 
l’assioma di costruibilità. Poiché Godei 
aveva dimostrato che la costruibilità im¬ 
plica l’assioma di scelta e l’ipotesi del 
continuo, questo è il primo passo ne¬ 
cessario per negare una delle due pro¬ 
posizioni. 

Per poter effettuare questo primo 
passo si devono far vedere due cose : 
che a può essere scelto in modo da ri¬ 
manere non costruibile non solo in M 
ma anche in A e che N, come M, è 
un modello per la teoria ristretta degli 
insiemi. Per caratterizzare a, aggiriamo 
la questione. Immaginiamo di voler 
fare un elenco di tutte le possibili pro¬ 
posizioni su a in quanto insieme appar¬ 
tenente a N. Allora a sarà specificato se 
noi diamo una regola in base alla quale 
possiamo determinare se ognuna di que- 
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GEOMETRIA 

STADIO DI SVILUPPO 

TEORIA DEGLI INSIEMI 

TALETE, PITAGORA 

BASI INTUITIVE PER 1 PRIMI TEOREMI 

CANTOR 

ZENONE 

SCOPERTA DI PARADOSSI 

RUSSELL 

EUDOSSO, EUCLIDE 

BASI ASSIOMATICHE PER LA TEORIA STANDARD 

ZERMELO, FRAENKEL 

CARTESIO, HILBERT 

LE TEORIE STANDARD VENGONO DIMOSTRATE (RELATIVAMENTE) CONSISTENTI 

GDDEL 

GAUSS, RIEMANN 

SCOPERTA DI TEORIE NON STANDARD 

RICERCA ATTUALE 

MINKOWSKI, EINSTEIN 

APPLICAZIONI DELLA TEORIA NON STANDARD 

? ? ? 


Analogia fra l’evoluzione della geometria (a sinistra ) e della euclidea) è stata applicata nella relatività; la teoria non stan- 

teoria degli insiemi (a destra). La geometria non standard (non dard degli insiemi non ha ancora trovato applicazioni in fisica. 


ste proposizioni è vera oppure no. 

L’idea centrale risulta essere quella 
di scegliere a in modo che sia un ele¬ 
mento « generico », ossia di sceglierlo 
in modo che siano vere per a solo quel¬ 
le proposizioni che sono vere per quasi 
tutti gli insiemi in M. Questa è una 
nozione paradossale. Ogni insieme in 
M, infatti, gode tanto di proprietà pe¬ 
culiari che lo identificano, quanto anche 
di proprietà tipiche generali, che egli 
condivide praticamente con tutti gli 
insiemi di M. Ora risulta possibile de¬ 
determinare in modo rigoroso questa 
distinzione fra proprietà specifiche e ge¬ 
neriche si da renderla perfettamente 
esplicita e formale. Allora, quando sce¬ 
gliamo a come insieme generico (ossia 
come un insieme, per cosi dire, che 
non ha particolari proprietà che lo di¬ 
stinguano da ogni altro insieme in M) 
ne segue che N è ancora un modello 
per la teoria ristretta degli insiemi. Il 
nuovo elemento a che abbiamo intro¬ 
dotto non ha fastidiose proprietà che 
possano alterare il modello M da cui 
siamo partiti. Nel contempo a non è 
costruibile: ogni insieme costruibile ha 
un suo proprio carattere particolare 
- i passi mediante i quali può essere 
costruito - e il nostro a manca preci¬ 
samente di tale individualità. 

Per costruire un modello nel quale è 
falsa l’ipotesi del continuo, dobbiamo 
aggiungere a M non un solo elemento a 
ma una gran quantità di nuovi elementi, 
in effetti un numero infinito. Possiamo 
far questo in modo tale che gli elementi 
che noi aggiungiamo abbiano cardina- 
lità 


nel modello M. Anche qui può essere 
utile una approssimativa analogia geo¬ 
metrica : a un essere bidimensionale 
che vivesse immerso in una superficie 
non euclidea sarebbe impossibile rico¬ 
noscere che il suo mondo fa parte di 
uno spazio euclideo tridimensionale. 


Nel nostro caso noi, stando al di fuori 
di M, possiamo vedere che abbiamo im¬ 
messo solo un’infinità numerabile di 
nuovi elementi. Essi tuttavia sono tali 
che non possono essere numerati con 
nessun metodo disponibile in M stesso. 
Otteniamo cosi un nuovo modello N’ 
nel quale l’ipotesi del continuo è falsa. 
I nuovi elementi, che in N’ svolgono 
il ruolo di numeri reali (ossia, punti di 
un segmento hanno cardinalità maggio¬ 
re di 2 K o e cosi ora esiste un cardi¬ 
nale infinito - precisamente 2^o - che 

è maggiore di e tuttavia è minore 
di c poiché nel nostro modello N’ C 
è uguale a 

N 

2 (2 0) . 

Dal momento che possiamo costruire 
un modello della teoria degli insiemi nel 
quale l’ipotesi del continuo è falsa, pos¬ 
siamo aggiungere alla nostra ordinaria 
teoria degli insiemi ristretta l’assunzio¬ 
ne della falsità dell’ipotesi del continuo; 
non può sorgerne alcuna contraddizio¬ 
ne che non fosse già presente. Nello 
stesso ordine di idee possiamo costruire 
modelli per la teoria degli insiemi nei 
quali è falso l’assioma di scelta; possia¬ 
mo anche essere più specifici nel pre¬ 
cisare da quali insiemi infiniti è possi¬ 
bile « eseguire la scelta » e quali invece 
sono « troppo grandi perché si possa 
eseguire la scelta. » 

Mentre Godei otteneva i suoi risultati 
servendosi di un unico modello (gli in¬ 
siemi costruibili), nella teoria non can- 
toriana degli insiemi abbiamo non uno 
ma molti modelli, ognuno dei quali è 
opportunamente costruito per scopi par¬ 
ticolari. Ma forse più importante dei 
vari modelli è la tecnica che ci con¬ 
sente di costruirli : la nozione di « ge¬ 
nerico » e quella ad essa collegata di 
« costrizione » {forcing). In senso molto 
approssimativo gli insiemi generici han¬ 
no solo quelle proprietà che essi sono 
« costretti » (forced) ad avere per poter 
essere considerati insiemi. Per decidere 


se a è « costretto » ad avere certe pro¬ 
prietà dobbiamo riferirci a tutto N. E 
tuttavia N non resta realmente definito 
finché non abbiamo specificato a! Altro 
elemento chiave nella nuova teoria è 
appunto dato dall’elaborazione di un 
metodo per rendere non circolare que¬ 
sto argomento che apparentemente lo è. 

osa può suggerirci la storia della 
geometria per il futuro della teoria 
degli insiemi? Uno dei successi più no¬ 
tevoli della geometria non euclidea è 
stato quello di risultare un requisito 
preliminare essenziale per la teoria ge¬ 
nerale della relatività di Einstein. Rie- 
mann creò la geometria riemanniana 
con lo scopo puramente astratto di uni¬ 
ficare, chiarificare e approfondire la 
geometria non euclidea di Lobacevskij, 
Bolyai e Gauss. Questa geometria ri¬ 
sultò poi essere uno strumento essen¬ 
ziale e indispensabile per la rivoluzio¬ 
naria interpretazione einsteiniana della 
forza gravitazionale. 

È sufficiente questo esempio a giusti¬ 
ficare la fiducia che la teoria non canto- 
riana degli insiemi troverà un giorno 
un’applicazione oggi non prevedibile al 
mondo « reale » (ossia non matemati¬ 
co)? Nessuno, oggi, si impegnerebbe in 
una risposta. Certamente possiamo ve¬ 
dere (a posteriori) che la geometria ha 
sempre fornito lo sfondo essenziale nel 
quale si svolgono gli eventi fisici. In 
questo senso avremmo forse dovuto a- 
spettarci che progressi fondamentali in 
geometria avrebbero trovato un’appli¬ 
cazione fisica. La teoria degli insiemi 
non sembra oggi avere un’analoga rela¬ 
zione organica con la fisica, pure vi so¬ 
no stati alcuni matematici (Stanislaw 
Ulam, per esempio) che hanno sugge¬ 
rito che la teoria astratta degli insiemi 
potrebbe fornire utili modelli per la fi¬ 
sica teorica. Ma a questo punto dello 
sviluppo la cosa migliore è quella di ri¬ 
fiutarsi di fare ogni previsione attorno 
al futuro, se non quella che esso è im¬ 
prevedibile. 
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L’analisi non-standard 

Questa teoria matematica ha riportato in primo piano gli infinitesimi 
adoperati fin dalla antichità, ma spesso con dubbi, per 
risolvere problemi come quello di trovare l'area del cerchio 


di Martin Davis e Reuben Hersh 


L ’analisi non-standard, un nuovo 
ramo della matematica scoperto 
10 anni fa dal logico Abraham 
Robinson, segna un nuovo stadio di 
sviluppo per la soluzione di un gran 
numero di antichi e celebri paradossi. 
Robinson, ora all’Università di Yale, 
ha riesumato la nozione di « infinitesi¬ 
mo », cioè di un numero che è infinita¬ 
mente piccolo e tuttavia maggiore di 
zero. Questo concetto ha radici che af¬ 
fondano nella antichità. Per l’analisi 
tradizionale, o analisi « standard », ap¬ 
pariva palesemente auto-contraddito¬ 
rio. Eppure era stato un importante 
strumento in meccanica e in geome¬ 
tria almeno fin dai tempi di Archimede. 

Nel secolo XIX gli infinitesimi ven¬ 
nero eliminati dalla matematica una 
volta per tutte, o almeno cosi sembra¬ 
va. Per soddisfare le esigenze della lo¬ 
gica, il calcolo infinitesimale (o, co¬ 
me diremo semplicemente, il Calco¬ 
lo) di Isaac Newton o di Gottfried Wil¬ 
helm Leibniz fu riformulato da Karl 
Weierstrass senza infinitesimi. Ma og¬ 
gi è proprio la logica matematica, con 
la sua sottigliezza e le sue attuali ca¬ 
pacità, che ha riportato in vita l’infi¬ 
nitesimo e l’ha reso di nuovo accetta¬ 
bile. In un certo senso Robinson ha 
reso legittimo l’incauto trasporto dei 
matematici del XVII secolo contro il 
rigore pieno di scrupoli dei matemati¬ 
ci del XVIII secolo, aggiungendo un 
nuovo capitolo alla interminabile con¬ 
tesa tra finito e infinito, continuo e di¬ 
scontinuo. 

Nelle controversie sul concetto di in¬ 
finitesimo che accompagnarono lo svi¬ 
luppo del Calcolo, la geometria di Eu¬ 
clide era Io standard rispetto al quale i 
moderni si misuravano. In Euclide so¬ 
no deliberatamente esclusi sia l’infinito 
sia l’infinitesimo. Leggiamo in Euclide 
che un punto è ciò che ha posizione, 
ma non grandezza. Si è detto che tale 
definizione è priva di significato, ma 


forse è solo un impegno ad astenersi 
dall’uso di ragionamenti infinitesimali; 
e ciò costituiva il rifiuto di precedenti 
concetti del pensiero greco. Si pensa¬ 
va che l’atomismo di Democrito si ri¬ 
ferisse non solo alla materia, ma an¬ 
che al tempo e allo spazio. Ma allora 
gli argomenti di Zenone avevano reso 
insostenibile la nozione di tempo come 
sequenza di istanti successivi, o di li¬ 
nea come sequenza di successivi « in¬ 
divisibili ». Aristotele, fondatore della 
logica formale, bandiva dalla geometria 
l’infinitamente grande o piccolo. 

Ecco un esempio tipico dell’uso di 
ragionamenti infinitesimali in geome¬ 
tria: 

« Vogliamo trovare la relazione tra 
l’area del cerchio e la sua circonferen¬ 
za. Per semplicità, supponiamo che il 
raggio del cerchio sia 1. Ora, la cir¬ 
conferenza può essere pensata come 
composta di un numero infinito di seg¬ 
menti rettilinei, tutti eguali tra loro e 
infinitamente corti. Il cerchio è allora 
la somma di triangoli infinitesimi, che 
hanno tutti altezza 1. Per un triango¬ 
lo l’area è data dalla metà del prodot¬ 
to della base per l’altezza. Dunque la 
somma delle aree dei triangoli è l’area 
del cerchio, mentre la somma delle ba¬ 
si dei triangoli è la sua circonferenza. 
Dunque l’area del cerchio di raggio 1 
è eguale alla metà della sua circonfe¬ 
renza ». 

Questo ragionamento, che Euclide 


avrebbe respinto, fu pubblicato nel XV 
secolo da Nicola Cusano. La sua con¬ 
clusione è ovviamente vera, ma non è 
diffìcile sollevare obbiezioni a questo 
modo di procedere. La nozione di 
triangolo con base infinitamente picco¬ 
la è perlomeno ambigua. Certamente 
la base di un triangolo deve avere lun¬ 
ghezza o zero o maggiore di zero. Se 
è zero, allora l’area è zero e, per quan¬ 
ti termini sommiamo, non otteniamo 
altro che zero. D’altra parte, se è mag¬ 
giore di zero, per quanto piccola, se 
sommiamo un numero infinito di ter¬ 
mini eguali, otteniamo una somma in¬ 
finitamente grande. In nessuno dei due 
casi possiamo ottenere un cerchio di 
circonferenza finita come somma di 
un numero infinito di parti identiche. 

L’essenza di questa confutazione è 
l’asserzione che un numero diverso da 
zero anche molto piccolo diventa arbi¬ 
trariamente grande se viene aggiunto 
a se stesso un numero di volte suffi¬ 
ciente. Poiché tale asserzione fu resa 
esplicita per la prima volta da Archi- 
mede, è detta proprietà archimedea dei 
numeri reali. Un infinitesimo, se esi¬ 
stesse, sarebbe appunto un numero 
non-archimedeo: un numero maggiore 
di zero, che nondimeno resterebbe per 
esempio minore di 1, qualunque nume¬ 
ro (finito) di volte fosse sommato a se 
stesso. Archimede, che operava se¬ 
guendo la tradizione di Aristotele e di 
Euclide, asserì che ogni numero è ar- 


II metodo di esaustione viene usato per dimostrare in modo indiretto che l’area 
di un cerchio di raggio 1 è eguale alla metà della sua circonferenza. Nella dimostra¬ 
zione della pagina a fronte, un poligono A è circoscritto al cerchio (prima figura tn 
alto), formando un certo numero di triangoli le cui aree possono essere immediatamen¬ 
te calcolate. Aumentando il numero dei lati del poligono, come nel poligono B e nel 
poligono N, i triangoli crescono di numero e diventano più sottili mentre la differenza 
tra l’area del cerchio e quella del poligono diventa più piccola. Tale differenza non 
sarà mai nulla, tuttavia, per un poligono con un numero finito qualunque di lati. L’ana¬ 
lisi standard supera questa difficoltà asserendo che, al crescere all’infinito del numero 
dei lati, l’area del poligono si approssima all’area del cerchio come a un limite. L’ana¬ 
lisi non-standard fa a meno del concetto di limite per una spiegazione più intuitiva 
facendo uso di un poligono con un numero infinito di lati, di lunghezza infinitesimale. 
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POLIGONO A 





PERIMETRO P’ = 12 b’ 

AREA DEL POLIGONO B = 6b’ = V,P' 
CIRCONFERENZA DEL CERCHIO INSCRITTO < P’ 
AREA DEL CERCHIO INSCRITTO < V 2 P 


POLIGONO N 




PERIMETRO P" = nb" 

AREA DEL POLIGONO N = = '/ 2 P" 

2 

CIRCONFERENZA DEL CERCHIO INSCRITTO « P" 
AREA DEL CERCHIO INSCRITTO ~ '/ 2 P" 
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chimedeo; non ci sono dunque infini¬ 
tesimi. Archimede, tuttavia, era pure 
un filosofo della natura, un ingegnere 
e un fisico. Faceva uso di infinitesimi 
e della sua intuizione fisica per risol¬ 
vere problemi della geometria della pa¬ 
rabola. Allora, visto che gli infinitesi¬ 
mi « non esistono », diede una dimo¬ 
strazione « rigorosa » dei suoi risultati, 
servendosi « del metodo di esaustione », 
che si basa su un ragionamento diret¬ 
to e su costruzioni puramente finite. 
La dimostrazione rigorosa è data nel 
suo trattato Sulla quadratura della pa¬ 
rabola, noto fin dall’antichità. L’uso 
degli infinitesimi, che in realtà serviva 
a trovare la soluzione del problema, è 
contenuto in uno scritto chiamato Sul 
Metodo, che rimase sconosciuto sino 
alla sua sensazionale scoperta nel 1906. 

J1 metodo di esaustione di Archime¬ 
de, che evita il ricorso agli infinite¬ 
simi, è concettualmente vicino al me¬ 


todo « epsilon-delta » con cui Weier- 
strass e i suoi allievi nel XIX secolo 
bandirono i metodi infinitesimali dal¬ 
l’Analisi. È facile spiegarlo facendo ri¬ 
ferimento al nostro esempio del cer¬ 
chio pensato come un poligono di infi¬ 
niti lati. Vogliamo ottenere una dimo¬ 
strazione logicamente accettabile del¬ 
l’enunciato « L’area del cerchio con 
raggio 1 è eguale alla metà della cir¬ 
conferenza », che abbiamo trovato ser¬ 
vendoci di un ragionamento logicamen¬ 
te inaccettabile. 

Ragioniamo come segue. L’enuncia¬ 
to esprime l’eguaglianza di due quanti¬ 
tà associate a un cerchio di raggio 1: 
l’area e la metà della circonferenza. 
Cosi, se l’enunciato fosse falso, una di 
queste quantità sarebbe maggiore del¬ 
l’altra. Sia A il numero positivo otte¬ 
nuto sottraendo la minore dalla mag¬ 
giore. Ora, possiamo circoscrivere alla 
circonferenza un poligono regolare di 
tanti lati quanti si voglia. Dal momen¬ 


to che il poligono è composto di un nu¬ 
mero finito di triangoli finiti di altezza 
1, sappiamo che la sua area è eguale 
alla metà del suo perimetro. Renden¬ 
do il numero dei lati sufficientemente 
grande, possiamo far si che l’area del 
poligono differisca dall’area del cer¬ 
chio per meno della metà di A (qua¬ 
lunque valore si sia preso per A); allo 
stesso tempo il perimetro del poligono 
differirà dalla circonferenza per meno 
della metà di A. Ma allora l’area e il 
semiperimetro della circonferenza dif¬ 
feriranno per meno di A, il che con¬ 
traddice l’ipotesi di partenza. Dunque 
tale ipotesi è assurda e A deve essere 
zero, come volevasi dimostrare. 

Questo ragionamento da un punto 
di vista logico è impeccabile. Parago¬ 
nato con il procedimento diretto con 
cui si è precedentemente analizzata la 
questione, esso presenta un che di me¬ 
ticoloso, anzi di pedante. Dopo tutto, 
se l’uso di infinitesimi dà la risposta 
giusta, non sarà corretto per certi 
aspetti anche il ragionamento? Anche 
se non siamo in grado di giustificare i 
concetti che esso adopera, come può 
essere di fatto errato se ci fa giungere 
a un risultato corretto? 

'J 1 ale difesa degli infinitesimi non fu 
fatta da Archimede. In realtà nel¬ 
lo scritto Sul Metodo egli ha cura di 
spiegare che « le verità qui enunciate 
non vengono di fatto dimostrate con il 
ragionamento usato » e che una dimo¬ 
strazione rigorosa è stata pubblicata a 
parte. D’altra parte, Nicola Cusano, 
che era cardinale, preferiva il ragiona¬ 
mento per quantità infinite per via 
della sua convinzione che l’infinito co¬ 
stituisse « la fonte, e i mezzi, e ne! me¬ 
desimo tempo lo scopo irraggiungibile 
di tutta la conoscenza ». Cusano fu se¬ 
guito nel suo misticismo da Giovanni 
Keplero, uno dei fondatori della scien¬ 
za moderna. In un’opera oggi meno 
nota delle sue scoperte nel campo del¬ 
la astronomia, Keplero nel 1612 usava 
gli infinitesimi per trovare le propor¬ 
zioni ottimali per una botte di vino. 
Egli non era toccato dalle autocontrad¬ 
dizioni del suo metodo; faceva assegna¬ 
mento sulla ispirazione divina, e scri¬ 
veva che « la natura insegna la geome¬ 
tria solo per istinto, anche senza razio¬ 
cinio ». Per di più, le sue formule per 
il volume della botte sono corrette. 

Il più famoso mistico matematico fu 
senza dubbio Blaise Pascal. Risponden¬ 
do a quei contemporanei che solleva¬ 
vano obbiezioni contro il. ragionamen¬ 
to con quantità infinitamente piccole, 
Pascal proclamava con entusiasmo che 
il cuore interviene a rendere l’opera 
chiara. Pascal guardava all’infinitamen- 



II problema della botte fu affrontato da Keplero servendosi di infinitesimi nella sua Nova 
stereometria doliorum vinariorum, pubblicata nel 1615. Il problema che Keplero si era 
posto consisteva nel trovare le dimensioni ottimali di una botte di vino. In figura è ri¬ 
prodotta una pagina -tratta da una ristampa ottocentesca dell’opera edita in Europa. 
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POSIZIONE DELLA 


WEIERSTRASS 

PIETRA CHE CADE 

ROBINSON 


s = 4,9f 2 


Sia (' = 1 + A t. A t è 


Sia t’ — 1 + dt. dt è 

un numero reale positivo. 


un numero positivo 

S' = 4,9 + 9,8 A t + 4,9 (A t) 2 . 

• 

infinitesimo. 

A S = S' — S 

= 9,8 A t + 4,9 (A t ) 2 . 


s' = 4,9 + 9,Sdt + 4,9 {dt) 2 . 

A s 


ds = s' — s 

-= 9,8 + 4,9 A t. 

A t 


= 9,8 dt + 4,9 (dt) 2 . 

Assegnato un qualsiasi numero 
reale positivo e, arbitrariamente 
piccolo, scegliamo 


ds 

— = 9,8 + 4,9 dt. 
dt 

E 

# 

Poiché dt è infinitesimo, 

8 = —. 


io è anche 4,9df. 9,8 è 

4,9 


un numero reale standard. 

Allora per tutti i A / < 8. 


Così : 

A S 

-9,8 = 4,9 A t < 4,9 5 


velocità istantanea = 

A t 


ds 



parte standard di — = 9 8. 

— 4,9 . — = £ . 


dt 

4,9 



Così: 

velocità istantanea = 



A s 



lim -= 9,8. 

A t -> 0 A t 

• 



Soluzione del problema della caduta di una pietra secondo l’analisi standard 
(a sinistra) e secondo l’analisi non-slandard (a destra). L’analisi standard, esem¬ 
plificata dal matematico tedesco dell’800, Karl Weierstrass, calcola la velocità della 
pietra che cade in ogni istante senza servirsi di infinitesimi, definendo invece la ve¬ 
locità istantanea come un limile che è approssimato da rapporti di incrementi finiti. 
Abraham Robinson della Università di Yale, creatore dell’analisi non-standard, compie 
questo calcolo servendosi invece di una versione modificata del metodo infinitesimale. 


te grande e all’infinitamente piccolo co¬ 
me a misteri, come a qualcosa che la 
natura ha posto innanzi all’uomo non 
perché l’uomo la comprenda, ma per¬ 
ché l’uomo la ammiri. 

La piena fioritura del metodo degli 
infinitesimi si ebbe con le generazioni 
dopo Pascal: Newton, Leibniz, i fra¬ 
telli Bernoulli (Jacopo e Giovanni) e 
Leonardo Eulero. I teoremi fondamen¬ 
tali del Calcolo furono trovati da New¬ 
ton e Leibniz tra il 1660 e il 1680. Il 
primo libro di testo sul Calcolo fu 
scritto nel 1696 dal marchese de l’Hó- 
pital, un discepolo di Leibniz e di Gio¬ 
vanni Bernoulli. Qui si enuncia all’esor¬ 
dio, come assioma, il fatto che due 
quantità che differiscono per un infini¬ 
tesimo possono essere considerate 
eguali. In altri termini, nel medesimo 
tempo tali quantità si considerano 
eguali e non eguali tra loro! Un secon¬ 
do assioma dice che una curva è « la 
totalità costituita da una infinità di seg¬ 
menti retti, ciascuno infinitamente pic¬ 
colo ». Ciò costituisce una aperta ripre¬ 
sa dei metodi che Aristotele aveva ban¬ 
dito 2000 anni prima. 

In effetti, scriveva de l’Hópital, « la 
usuale analisi ha a che fare solo con 
quantità finite; questa invece si adden¬ 
tra tanto profondamente quanto la 
stessa infinità. Essa paragona le diffe¬ 
renze infinitamente piccole di quantità 
finite; scopre le relazioni tra queste 
differenze e in questo modo rende no¬ 
te le relazioni che intercorrono tra le 
quantità finite che si comportano co¬ 
me fossero infinite in confronto alle 
quantità infinitamente piccole. Si po¬ 
trebbe anche dire che questa analisi si 
estende oltre l’infinito, perché non si 
limita alle differenze infinitamente pic¬ 
cole ma scopre anche le relazioni tra 
le differenze di queste differenze ». 

Newton e Leibniz non partecipava¬ 
no all’entusiasmo di de l’Hópital. Leib¬ 
niz non proclamava che gli infinitesi¬ 
mi esistevano realmente, ma solo che 
si può ragionare come se esistessero 
senza commettere errore. Sebbene 
Leibniz non fosse in grado di dare fon¬ 
damento a tale affermazione, l’opera 
di Robinson mostra che in un certo 
qual senso dopo tutto aveva ragione 
lui. Newton cercava invece di elimina¬ 
re gli infinitesimi. Nei suoi Principia 
Mathematica, come nell’opera Sulla 
quadratura della parabola di Archime¬ 
de, risultati che erano stati in origine 
trovati con metodi infinitesimali sono 
presentati in una veste euclidea pura¬ 
mente finita. 

| a dinamica era divenuta importante 

quanto la geometria nel porre pro¬ 
blemi all’analisi matematica. Il proble¬ 


ma principale era quello di porre in re¬ 
lazione « fluenti » e « flussioni », che 
oggi si chiamerebbero posizioni istan¬ 
tanee e velocità istantanee di un corpo 
in movimento. 

Consideriamo una pietra che cade. 
Il suo movimento è descritto assegnan¬ 
done la posizione come funzione del 
tempo. Mentre cade, la sua velocità 
cresce, sicché la velocità in ogni istan¬ 
te è essa pure una funzione variabile 
del tempo. Newton chiamava « fluen¬ 
te » la funzione posizione e « flussio¬ 
ne » la funzione velocità. Se una delle 
due è data, si può determinare anche 
l’altra; questa relazione è il nucleo del 
calcolo infinitesimale costruito da New¬ 
ton e da Leibniz. 

Nel caso della caduta di una pietra 
la funzione fluente è data dalla formu¬ 
la s = 4,9 1 2 , dove s è il numero dei 
metri percorsi e / è il numero di se¬ 
condi trascorsi dal momento in cui si 
è fatta cadere la pietra. Al cadere del¬ 
la pietra aumenta rapidamente la sua 
velocità. Come possiamo calcolare la 
velocità della pietra in un certo istan¬ 
te di tempo, per esempio all’istante 
t = 1? 

Potremmo trovare la velocità media 
per un intervallo di tempo finito ser¬ 
vendoci di una formula elementare: la 
velocità è eguale alla distanza divisa 
per il tempo. Possiamo usare questa 
formula per trovare la velocità istan¬ 
tanea? In un incremento infinitesimo 
del tempo l’incremento della distanza 


sarebbe esso pure infinitesimo; il loro 
rapporto, la velocità media per tale in¬ 
tervallo infinitesimo, dovrebbe essere 
la velocità istantanea finita che cer¬ 
chiamo. 

Rappresentiamo con dt l’incremen¬ 
to infinitesimo del tempo e con ds il 
corrispondente incremento della distan¬ 
za (ovviamente ds e dt debbono essere 
pensati ciascuno come un solo simbo¬ 
lo e non come d volte t o d volte s). 
Vogliamo calcolare il rapporto ds/dt 
che deve essere finito. Per trovare l’in¬ 
cremento della distanza da t = 1 a 
t = \ + dt calcoliamo la posizione del¬ 
la pietra quando t = 1, che è 4,9 X 
l 2 = 4,9, e la sua posizione quando 
t = 1 + dt, che è 4,9 X (1 + dt) 2 . Ba¬ 
sta un po’ di algebra elementare per 
trovare che ds, cioè l’incremento del¬ 
la distanza, è 9,8 dt + 4,9 dt 2 . Cosi il 
rapporto ds/dt, che è la quantità che 
stiamo cercando, è eguale a 9,8 + 4,9 dt. 

Abbiamo risolto il nostro problema? 
Dal momento che il risultato cercato 
dovrebbe essere una quantità finita, si 
dovrebbe eliminare il termine infinite¬ 
simo, 4,9 dt, e ottenere come risultato 
9,8 metri al secondo per la velocità 
istantanea. Ciò è proprio quel che il 
vescovo Berkeley non ci permetterà di 
fare. 

J^a brillante e spietata critica al me¬ 
todo infinitesimale di Berkeley, 
The Analyst, apparve nel 1734. Il li¬ 
bro era rivolto a « un matematico sen- 
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za fede », che generalmente si ritiene 
fosse l’astronomo Edmund Halley, 
amico di Newton. Halley aveva finan¬ 
ziato la pubblicazione dei Principia e 
aveva contribuito alla loro preparazio¬ 
ne per la stampa. Si dice pure che egli 
avesse persuaso un amico di Berkeley 
della « inconcepibilità delle dottrine del 
cristianesimo »; il vescovo Berkeley ri¬ 
spose che le flussioni di Newton erano 
« oscure, ripugnanti e precarie » come 
nessun punto della teologia. 

« Chiederò per me il privilegio del 
Libero Pensatore - scrisse Berkeley - e 
mi prenderò la libertà di ricercare sul¬ 
l’oggetto, sui principi, e sul metodo di 
dimostrazione ammessi dai matematici 
del tempo presente, con la stessa disin¬ 
voltura con cui voi presumete di trat¬ 
tare i principi e i misteri della reli¬ 
gione ». Berkeley affermò che il pro¬ 
cedimento di Leibniz, che consiste¬ 
va semplicemente nel « considerare » 

9,8 + 4,9 dt come « lo stesso » che 9,8 
era inintellegibile. « E non servirà nep¬ 
pure - scrisse - dire che [il termine 
trascurato] è una quantità estrema- 
mente piccola; poiché ci hanno detto 
che in rebus mathematicis errores 
quam minimi non sunt contemnendi ». 
Se qualcosa è trascurato, per quanto 
piccolo, non possiamo più affermare di 
avere la velocità esatta, ma solo una 
approssimazione. 

Newton, a differenza di Leibniz, cer¬ 
cò nei suoi scritti più tardi di addolci¬ 
re la « durezza » della dottrina degli 
infinitesimi servendosi di un linguaggio 
ricco di riferimenti alla fisica. « Con 
velocità ultima si intende quella con 
cui il corpo è mosso, né prima che ar¬ 
rivi all’ultima posizione, quando il mo¬ 
vimento cessa, né dopo, ma quella al¬ 
l’istante stesso in cui vi arriva ... E, pa¬ 
rimenti, come ultima ragione di quan¬ 
tità evanescenti si deve intendere il 
rapporto di quantità, né prima che es¬ 
se scompaiono, né dopo, ma quel rap¬ 


porto con cui esse scompaiono ». Quan¬ 
do procedeva al calcolo, tuttavia, egli 
doveva giustificare l’eliminazione dei 
termini « trascurabili » non voluti che 
comparivano nel risultato trovato. Il 
procedimento newtoniano consisteva nel 
trovare per prima cosa, come abbiamo 
fatto anche noi, ds/dt = 9,8 + 4,9 dt e 
quindi nel porre l’incremento dt egua¬ 
le a zero, lasciando come risultato fi¬ 
nale esatto solo 9,8. 

Ma, scrisse Berkeley, « questo ragio¬ 
namento non sembra né corretto né 
conclusivo ». Dopo tutto, dt o è egua¬ 
le a zero oppure non lo è. Se dt è di¬ 
verso da zero, allora 9,8 + 4,9 dt è di¬ 
verso da 9,8. Se dt è zero, allora l’in¬ 
cremento della distanza ds è esso pu¬ 
re zero, e la frazione ds/dt non è 

9,8 + 4,9 dt, ma un’espressione priva 
di significato, 0/0. «Perché, una volta 
ammesso che gli incrementi scompa¬ 
iono, cioè che gli incrementi siano nul¬ 
la o che non vi siano incrementi, cade 
la precedente ipotesi che gli incremen¬ 
ti fossero qualcosa, o che vi fossero 
incrementi, mentre viene mantenuta 
una conseguenza di tale ipotesi, cioè 
un’espressione ottenuta mediante es¬ 
sa. » Ma questo è un modo fallace di 
ragionare. Quasi ironicamente Berkeley 
concludeva: « Che sono queste flussio¬ 
ni? La velocità di incrementi evane¬ 
scenti. E che sono questi stessi incre¬ 
menti evanescenti? Non sono né quan¬ 
tità finite, né quantità infinitamente 
piccole, e neppure nulla. Perché non 
chiamarle fantasmi di quantità sva¬ 
nite? ». 

j^on si potè dare risposta alla logica 
di Berkeley; nondimeno, i matema¬ 
tici persistettero nell’uso degli infinitesi¬ 
mi per un altro secolo, e con grande 
successo. E in realtà fisici e ingegneri 
non hanno mai cessato di usarli. Nella 
matematica pura, d’altra parte, si ebbe 
nel XIX secolo un ritorno al rigore eu¬ 


SIMBOLO 

SIGNIFICATO CONVENUTO 


non 

& 

e 

V 

c 

-> 

implica 

V 

per tutti 

3 

esiste almeno un 

= 

eguale 

x y z 

variabili che variano su numeri reali 

f g h 

variabili che variano su altri oggetti 

+ . < 

piu, per, minore di 

( ) N 

parentesi 

0 1 2 

simboli per particolari numeri 


I simboli usati nel linguaggio formale L, in cui si può esprimere il calcolo, sono 
tradotti in italiano in questo dizionario parziale. Il linguaggio formale, che impiega 
molti più simboli di questi, fornisce un legame tra l’universo standard e il più ampio 
universo non-standard che è un concetto centrale della analisi matematica non-standard. 


clideo, che raggiunse il culmine sotto 
la guida di Weierstrass nel 1872. È in¬ 
teressante osservare che il XVIII seco¬ 
lo - che fu il grande momento degli 
infinitesimi - fu l’epoca in cui non si 
riconoscevano barriere tra matematica 
e fisica. I fisici di punta e i matematici 
di punta erano le stesse persone. Quan¬ 
do la matematica pura ricomparve co¬ 
me disciplina a sé stante, i matematici 
di nuovo si assicurarono che i fonda¬ 
menti della loro attività non contenes¬ 
sero ovvie contraddizioni. L’analisi 
moderna rese saldi i suoi fondamenti 
facendo quello che già i greci avevano 
fatto: bandendo gli infinitesimi. 

Per trovare la velocità istantanea se¬ 
guendo il metodo di Weierstrass, ab¬ 
bandoniamo ogni tentativo di calcola¬ 
re la velocità come un rapporto. Defi¬ 
niamo invece la velocità come un limi¬ 
te, che è approssimato da rapporti di 
incrementi finiti. Sia A t una variabile 
che rappresenta un incremento finito 
del tempo e As la corrispondente va¬ 
riabile per l’incremento dello spazio. 
Allora As/At è la quantità variabile 

9,8 + 4,9Ar. Scegliendo A t sufficiente¬ 
mente piccolo possiamo far si che 
As/At assuma valori tanto prossimi 
quanto si voglia al valore 9,8, e cosi, 
per definizione, la velocità all’istante 
t = 1 è proprio 9,8. 

Questo procedimento riesce a elimi¬ 
nare ogni riferimento a numeri non 
finiti. Evita anche ogni tentativo di 
porre immediatamente A t eguale a ze¬ 
ro nella frazione As/At. In questo mo¬ 
do evitiamo entrambi i trabocchetti lo¬ 
gici presentati da Berkeley. Ne paghia¬ 
mo, tuttavia, il prezzo. La velocità 
istantanea, quantità intuitivamente per¬ 
spicua e fisicamente misurabile, diven¬ 
ta soggetta alla nozione di limite che è 
estremamente raffinata. Se analizziamo 
nei particolari cosa significa, abbiamo 
il seguente scioglilingua: 

« La velocità è v se, per ogni nume¬ 
ro positivo e, As/At — v è minore di e 
in valore assoluto per tutti i valori di 
A t minori in valore assoluto di un cer¬ 
to numero positivo 5 (che dipenderà 
da e e da t) ». 

Abbiamo definito v con una sottile 
relazione tra due nuove quantità, e e 5, 
che, in certo senso, sono irrilevanti ri¬ 
spetto a v stesso. Perlomeno la non co¬ 
noscenza di e e 8 non impedi mai a 
Bernoulli o a Eulero di calcolare una 
velocità. La verità è che in realtà co¬ 
noscevamo cosa era la velocità istan¬ 
tanea prima ancora di avere appreso 
questa definizione; infatti solo per coe¬ 
renza logica accettiamo una definizio¬ 
ne che è molto più difficile da capire 
del concetto definito. Naturalmente, 
per un matematico allenato, la defini- 
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PROPOSIZIONE FORMALE DI L 

INTERPRETAZIONE NEL¬ 
L'UNIVERSO STANDARD 

INTERPRETAZIONE NEL¬ 
L'UNIVERSO NON-STANDARD 

(Vx) ( 3y) [x = 0 V x y = 1] 

Ogni numero reale 

Ogni numero reale 

Letteraimente: Per 

diverso da zero 

non-standard diverso da 

tutti gli x, esiste un y 
tale che x = 0 o 
xy = 1 

ammette un inverso. 

zero ammette un inverso 
non-standard; in particolare, 
infinitesimi positivi 
ammettono come inverso 
numeri maggiori di 
qualsiasi numero reale 
standard, cioè numeri 
infiniti. 


La proposizione formale è enunciata nel linguaggio L. La colonna centrale dà la sua 
interpretazione nell’universo standard; quella di destra, nell’universo non-standard. 


zione epsilon-delta è intuitiva; questo 
mostra che cosa si può ottenere con 
un appropriato allenamento. 

La ricostruzione del Calcolo sulla 
base del concetto di limite e la sua de¬ 
finizione epsilon-delta portò a una ri¬ 
duzione del Calcolo stesso all’aritmeti¬ 
ca dei numeri reali. Sulla base di que¬ 
ste chiarificazioni dei fondamenti si fu 
.portati in modo del tutto naturale ad 
affrontare i fondamenti logici del siste¬ 
ma stesso dei numeri reali. Si ritornò 
cosi, dopo due millenni e mezzo, al 
problema dei numeri irrazionali, che i 
greci avevano abbandonato dopo Pita¬ 
gora come irresolvibile. Uno degli stru¬ 
menti largamente impiegato in questi 
tentativi fu proprio la logica mate¬ 
matica o logica simbolica, che si ve¬ 
niva nel frattempo potentemente svi¬ 
luppando. 

Più di recente si è scoperto che la 
logica matematica fornisce i fonda¬ 
menti concettuali alla teoria delle mac¬ 
chine calcolatrici e della programma¬ 
zione coi calcolatori. Quindi questo 
modello di purezzamatematica va og¬ 
gi considerato come proprio della par¬ 
te applicativa della matematica stessa. 

J1 legame tra logica e teoria dei calco¬ 
latori è in gran parte costituito dal¬ 
la nozione di linguaggio formale, che 
è il tipo di linguaggio che le macchine 
capiscono. Ed è la nozione di linguag¬ 
gio formale che ha permesso a Robin¬ 
son di precisare l’affermazione di Leib¬ 
niz che si può ragionare senza errore 
come se gli infinitesimi esistessero. 

Leibniz aveva pensato gli infinitesi¬ 
mi come numeri positivi o negativi in¬ 
finitamente piccoli che ancora godeva¬ 
no delle « stesse proprietà » degli usua¬ 
li numeri della matematica. A prima 
vista l’idea sembra autocontradditoria. 
Se gli infinitesimi godono delle mede¬ 
sime « proprietà » dei numeri usuali, 
come possono godere anche della « pro¬ 
prietà » di essere positivi e tuttavia mi¬ 
nori di ogni numero positivo usuale? 
Fu usando un linguaggio formale che 
Robinson potè risolvere il paradosso. 
Robinson mostrò come costruire un si¬ 
stema contenente infinitesimi identico 
al sistema dei numeri « reali » riguar¬ 
do a tutte le proprietà esprimibili in un 
certo linguaggio formale. Ovviamente, 
la « proprietà » di essere positivo e tut¬ 
tavia minore di ogni numero positivo 
usuale risulterà non esprimibile nel lin¬ 
guaggio e in questo modo si eluderà il 
paradosso. 

La situazione è nota a chi abbia tal¬ 
volta adoperato un calcolatore. Un cal¬ 
colatore accetta in entrata solo simbo¬ 
li di un certo elenco dato in preceden¬ 
za all’utente, e i simboli debbono esse¬ 
re usati seguendo certe regole prefissa¬ 


te. Il linguaggio comune, cosi come è 
impiegato nelle comunicazioni umane, 
è soggetto a regole che i linguisti sono 
ancora lontani dall’aver completamen¬ 
te compreso. Quando si comunica con 
i calcolatori, ci si accorge che essi so¬ 
no « stupidi », proprio per il fatto che 
- a differenza degli uomini - operano 
in un linguaggio formale con un voca¬ 
bolario prefissato e con un prefissato 
insieme di regole. Gli uomini invece 
comunicano in un linguaggio naturale, 
con regole che non sono mai state 
completamente esplicitate. 

La matematica è, naturalmente, una 
attività umana, come la filosofia o la 
progettazione dei calcolatori; come 
queste altre attività, essa è compiuta 
dall’uomo che si serVe di linguaggi 
naturali. Al medesimo tempo la mate¬ 
matica ha come caratteristica distinti¬ 
va quella di poter essere adeguatamen¬ 
te descritta da un linguaggio formale, 
che in un certo senso rispecchia in mo¬ 
do preciso il suo contenuto. Si potreb¬ 
be dire che la possibilità di formulare 
una scoperta matematica in un linguag¬ 
gio formale è la conferma del fatto 
che la si è compresa appieno. 

Nella analisi non-standard si pren¬ 
dono come punto di partenza i numeri 
reali finiti e il resto del Calcolo come 
è noto ai matematici standard. Chia¬ 
meremo questo « l’universo standard » 
e lo designeremo con la lettera M. Il 
linguaggio formale in cui parliamo di 
M può essere designato con L. Ogni 
proposizione in L è un enunciato su M 
e, naturalmente, deve essere o vera o 
falsa. Cioè, ogni proposizione di L o è 
vera o è vera la sua negazione. Chia¬ 
miamo K l’insieme di tutte le proposi¬ 
zioni vere e diciamo che M è un «mo¬ 
dello » per K. Con ciò vogliamo dire 
che M è una struttura matematica ta¬ 
le che ogni proposizione di K, una vol¬ 
ta interpretata come riferentesi a M, 
è vera. Ovviamente, noi non « cono¬ 
sciamo » K in un qualche modo effet¬ 
tivo; se cosi fosse avremmo con ciò 
stesso la risposta a ogni possibile pro¬ 


blema dell’analisi. Nondimeno, consi¬ 
deriamo K come se fosse un oggetto 
ben definito, a proposito del quale pos¬ 
siamo condurre ragionamenti e trarre 
conclusioni. 

Il fatto essenziale, il punto principa¬ 
le, è che, oltre a M, universo standard, 
vi sono anche modelli non-standard di 
K. Cioè, esistono strutture matemati¬ 
che, M*, differenti da M in modo essen¬ 
ziale (in un senso che spiegheremo) e 
che nondimeno sono modelli di K nel 
senso usuale del termine: ci sono og¬ 
getti in M* e relazioni tra oggetti di 
M* tali che se reinterpretiamo i sim¬ 
boli di L in modo da riferirli a questi 
pseudo-oggetti e pseudo-relazioni in 
modo opportuno, allora ogni proposi¬ 
zione di A! è ancora vera, anche se con 
un differente significato. 

Una analogia grossolana può aiuta¬ 
re l’intuizione. Sia M l’insieme di tut¬ 
ti gli studenti della Facoltà di scienze. 
Supponiamo, per il nostro ragionamen¬ 
to, che tutti questi studenti siano stati 
fotografati per l’annuario, in cui tutte 
le fotografie degli studenti compaiono 
in formato tessera. Allora M* potrà 
essere l’insieme di tutte le fotografie 
formato tessera di ogni pagina dell’an¬ 
nuario. Senza dubbio, con un’ovvia in¬ 
terpretazione, ogni affermazione vera 
a proposito di uno studente della Fa¬ 
coltà di scienze, corrisponde a una af¬ 
fermazione vera a proposito di una 
certa fotografia dell’annuario; tuttavia 
ci sono molte fotografie nell’annuario 
che non corrispondono ad alcuno stu¬ 
dente. M* è molto più ampio di M ; 
oltre agli elementi che corrispondono 
agli elementi di M, contiene anche 
molti altri elementi. 

Quindi l’enunciato « Giuseppe Rossi 
è più bravo di Paolo Bianchi », una 
volta che sia interpretato in M*, è un 
enunciato a proposito di due partico¬ 
lari fotografie. Esso non è vero se la 
relazione « più bravo di » è interpreta¬ 
ta in maniera usuale, standard. Cosi 
« più bravo di » si deve reinterpretare 
come una pseudo-relazione, tra pseu- 
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do-studenti (cioè fotografìe di studen¬ 
ti). Potremmo definire la pseudo-rela¬ 
zione « più bravo di » (fra virgolette) 
dicendo che la fotografia contrassegna¬ 
ta « Giuseppe Rossi » è « più brava 
della » fotografia contrassegnata « Pao¬ 
lo Bianchi » solo se Giuseppe Rossi è 
di fatto più bravo di Paolo Bianchi. In 
questo modo enunciati veri a proposi¬ 
to di studenti sono interpretati come 
enunciati veri a proposito di fotografie. 

Naturalmente, in questo esempio, 
l’intero ragionamento è un po’ costrui¬ 
to ad hoc. Tuttavia, se M è l’universo 
standard per il Calcolo, M*, universo 
non-standard, è un’entità rilevante e 
interessante. 

Resistenza di interessanti modelli non¬ 
standard fu per la prima volta sco¬ 
perta dal logico norvegese Thoralf A. 
Skolem, che trovò che gli assiomi del 
« contare » - gli assiomi che descrivono 
i « numeri naturali » 1,2, 3, ecc. - am¬ 
mettono modelli non-standard che con¬ 
tengono « strani » oggetti non contem¬ 
plati dalla usuale aritmetica. La grande 
intuizione di Robinson fu di compren¬ 
dere come questo originale risultato 
della logica formale moderna poteva 
costituire la base per far rivivere i me¬ 
todi infinitesimali nel calcolo differen¬ 
ziale e integrale. In questa ripresa egli 
si basava su un teorema dimostrato 
per la prima volta dal logico russo 
Anatolij Malcev e generalizzato in se¬ 
guito da Leon A. Henkin, dell’Univer¬ 
sità della California a Berkeley. Que¬ 
sto teorema è il teorema di « compat¬ 
tezza ». Esso è legato al celebre teore¬ 
ma « di completezza » di Kurt Godei, 


che afferma che un insieme di propo¬ 
sizioni è logicamente coerente (nessu¬ 
na contraddizione può cioè esser dedot¬ 
ta dalle proposizioni) se e solo se le pro¬ 
posizioni hanno un modello, cioè se e 
solo se c’è un « universo » in cui esse 
sono tutte vere. 

Il teorema di compattezza afferma: 
supponiamo di avere una collezione di 
proposizioni del linguaggio L. Suppo¬ 
niamo che nell’universo standard ogni 
sottoinsieme finito di questa collezione 
sia vero. Esiste allora un universo non- 
-standard in cui tutte le proposizioni 
dell’intera collezione sono simultanea¬ 
mente vere. 

Il teorema di compattezza segue fa¬ 
cilmente dal teorema di completezza: 
se ogni sottoinsieme finito di una col¬ 
lezione di proposizioni di L è vero nel¬ 
l’universo standard, allora ogni sotto¬ 
insieme finito è logicamente coerente. 
Cosi l’intera collezione di proposizioni 
è logicamente coerente (poiché ogni de¬ 
duzione può fare uso solo di un nume¬ 
ro finito di premesse). Per il teorema 
di completezza c’è un universo (non- 
-standard) in cui è vera l’intera colle¬ 
zione. 

Una diretta conseguenza del teore¬ 
ma di compattezza è « 1’esistenza » di 
infinitesimi. Per vedere come questo 
sorprendente risultato segua dal teore¬ 
ma di compattezza consideriamo le 
proposizioni: 

« c è un numero maggiore di zero e 
minore di 1/2» 

« c è un numero maggiore di zero e 
minore di 1 /3 » 

« c è un numero maggiore di zero e 
minore di 1/4», e cosi via. 


LINGUAGGIO L 


UNIVERSO 


STANDARD 



UNIVERSO NON-STANDARD 


PARTE STANDARD 
DELL’UNIVERSO 
NON-STANDARD 


Una raffigurazione schematica del ruolo di mediazione del linguaggio formale tra l’uni¬ 
verso standard e quello non-standard. Il linguaggio formale L descrive l’universo stan¬ 
dard, che include i numeri reali. Le proposizioni di L vere nell’universo standard sono 
vere anche in quello non-standard, che contiene ulteriori oggetti matematici, come gli 
infinitesimi. In questo modo l’analisi non-standard rende preciso il metodo infinitesimale. 


Questa è una collezione infinita di 
proposizioni, ciascuna delle quali può 
essere scritta servendosi del linguaggio 
formale L. Se ci riferiamo all’universo 
standard R dei numeri reali, ogni suo 
sottoinsieme finito è vero, perché se 
consideriamo solo un numero finito di 
proposizioni della forma « c è un nu¬ 
mero maggiore di zero e minore di 
1 /n », una delle proposizioni conterrà 
la frazione più piccola 1/n, e 1/2n sa¬ 
rà ovviamente maggiore di zero e mi¬ 
nore di tutte le frazioni che compaio¬ 
no nel nostro elenco finito di proposi¬ 
zioni. Tuttavia, se consideriamo l’inte¬ 
ro insieme infinito di queste proposi¬ 
zioni, esso risulta falso in riferimento 
ai numeri reali standard, poiché per 
quanto piccolo possiamo scegliere un 
numero reale positivo c. 1/n risulterà 
più piccolo di c prendendo n sufficien¬ 
temente grande. 

Il teorema di compattezza di Malcev 
ed Henkin asserisce che c’è un univer¬ 
so non-standard R* che contiene nu¬ 
meri pseudo-reali compreso un nume¬ 
ro pseudo-reale positivo c, minore di 
qualsiasi numero della forma 1/n. 
Cioè, c è infinitesimo. Inoltre c gode 
di tutte le proprietà dei numeri reali 
standard in un senso ben preciso: ogni 
enunciato vero a proposito di reali 
standard, che possiamo esprimere nel 
linguaggio formale L, è vero anche a 
proposito di reali non-standard, com¬ 
preso l’infinitesimo c - con un’oppor¬ 
tuna interpretazione. (La fotografia di 
« Giuseppe Rossi » non è più brava in 
realtà della fotografia di « Paolo Bian¬ 
chi », ma l’enunciato « Giuseppe Ros¬ 
si » è « più bravo di » « Paolo Bianchi » 
è vero, con la nostra interpretazione 
non-standard di « più bravo di »). D’al¬ 
tra parte, proprietà godute da tutti i 
numeri reali standard possono non es¬ 
sere trasferite agli pseudo-numeri non- 
-standard, se non è possibile esprimere 
queste proprietà nel linguaggio for¬ 
male L. 

La proprietà archimedea (non esi¬ 
stenza di infinitesimi) di R può essere 
espressa facendo uso di un insieme in¬ 
finito di proposizioni di L come segue 
(facciamo uso del simbolo « > » come 
al solito per significare « è maggiore 
di »). Per ogni elemento positivo c di 
R, sono vere tutte le proposizioni del 
tipo qui sotto riportato, tranne un nu¬ 
mero finito: 

c > 1 
c + c > 1 

c + c + c>le cosi via. 

Questo non è vero, tuttavia, per gli 
pseudo-reali R*: se c è infinitesimo 
(quindi pseudo-reale), tutte queste pro¬ 
posizioni sono false. In altri termini, 
nessuna somma di un numero finito di 
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addendi tutti eguali a c può essere 
maggiore di 1, qualunque numero di 
addendi prendiamo. Proprio il fatto che 
la proprietà archimedea è vera nel mo¬ 
dello standard, ma falsa in quello non- 
-standard, prova che la proprietà non 
può essere espressa con una proposi¬ 
zione di L; l’enunciato che abbiamo 
usato è in realtà costituito da un nu¬ 
mero infinito di proposizioni. Essi si 
comportano « formalmente » come og¬ 
getti standard eppure differiscono per 
importanti proprietà che non sono for¬ 
malizzabili in L. 

Benché l’universo non-standard sia 
concettualmente distinto da quello 
standard, è comodo pensare quest’ulti¬ 
mo come un ampliamento dell’univer¬ 
so standard. Poiché R* è un modello di 
L, ogni proposizione vera a proposito 
di R ha un’interpretazione in R*. In 
particolare i nomi di numeri in R han¬ 
no un’interpretazione come nomi di 
oggetti in R*. Possiamo per semplicità 
identificare l’oggetto di R* chiamato 
« 2 » con l’usuale numero 2 di R. Al¬ 
lora R* contiene i numeri reali stan¬ 
dard di R, insieme con un’ampia col¬ 
lezione di quantità infinitesime e infi¬ 
nite, in cui R è immerso. 

Un oggetto di R* (un numero pseu¬ 
do-reale) è detto infinito se è pseudo- 
-maggiore di ogni numero reale stan¬ 
dard; altrimenti è detto finito. Un nu¬ 
mero pseudo-reale positivo è detto in¬ 
finitesimo se è pseudo-minore di ogni 
numero reale positivo standard. Se la 
pseudo-differenza di due pseudo-reali è 
finita, diciamo che essi appartengono 
alla stessa « galassia »; l’asse pseudo- 
-reale contiene un numero infinito più 
che numerabile di galassie. Se la pseu¬ 
do-differenza di due pseudo-reali è in¬ 
finitesima, diciamo che essi apparten¬ 
gono alla stessa « monade » (termine 
che Robinson ha preso a prestito da¬ 
gli scritti filosofici di Leibniz). Se uno 
pseudo-reale r* è infinitamente vicino 
a un numero reale standard r, dicia¬ 
mo che r è la parte standard di r*. 
Tutti i reali standard sono ovviamente 
nella stessa galassia, che è detta galas¬ 
sia principale. Nella galassia principale 
ogni monade contiene uno e un solo 
numero reale standard. Questa mona¬ 
de è « l’intorno infinitesimo » di r: 
cioè, l’insieme dei numeri reali non- 
-standard infinitamente vicini a r. La 
nozione di monade risulta applicabile 
non solo ai numeri reali; ma anche a 
spazi metrici e topologici in genere. 
L’analisi non-standard è dunque rile¬ 
vante non solo per il Calcolo elemen¬ 
tare ma anche per l’intero campo del¬ 
la moderna analisi astratta. 

Quando diciamo che infinitesimi o 
monadi esistono, dovrebbe esser chia¬ 
ro che non intendiamo affatto ciò co¬ 


me sarebbe stato inteso da Euclide o 
da Berkeley. Lino a un secolo fa era 
tacitamente assunto da tutti i filosofi 
e matematici che l’oggetto della mate¬ 
matica fosse dotato di realtà obiettiva 
in un senso molto vicino a quello in 
cui l’oggetto della fisica è reale. Se esi¬ 
stessero o no gli infinitesimi era que¬ 
stione di fatto, non troppo differente 
dal problema se gli atomi materiali esi¬ 
stono o no. Oggi molti matematici, 
forse la maggior parte, non condivido¬ 
no più tale convinzione dell’esistenza 
obiettiva degli oggetti che essi studia¬ 
no. La teoria dei modelli non si com¬ 
promette in un modo o nell’altro su 
tali questioni ontologiche. Quel che i 
matematici vogliono dagli infinitesimi, 
non è una forma di esistenza materia¬ 
le, ma piuttosto il diritto di servirsi di 
essi nelle dimostrazioni. A questo sco¬ 
po tutto ciò di cui si ha bisogno è la 
certezza che una dimostrazione che 
faccia uso di infinitesimi non è più er¬ 
rata di una che non ne fa uso. 

L’impiego dell’analisi non-standard 
nella ricerca fa qualcosa di simile. Sup¬ 
poniamo di voler dimostrare un teore¬ 
ma che fa riferimento solo a oggetti 
standard. Se si immergono gli oggetti 
standard nell’ampliamento non-stan¬ 
dard, si può trovare una dimostrazio¬ 
ne molto più breve e più intuitiva 
usando oggetti non-standard. Il teore¬ 
ma è stato allora dimostrato in realtà 
facendo riferimento a un’interpretazio¬ 
ne non-standard dei suoi termini e 
simboli. Gli oggetti non-standard che 
corrispondono a oggetti standard han¬ 
no la proprietà caratteristica che pro¬ 
posizioni su di essi sono vere (nell’in¬ 
terpretazione non-standard) solo se la 
stessa proposizione è vera in riferimen¬ 
to a oggetti standard (nell’interpreta¬ 
zione standard). In questo modo dimo¬ 
striamo teoremi su oggetti standard 
ragionando su oggetti non-standard. 

Ricordiamo, per esempio, la « dimo¬ 
strazione » di Nicola Cusano che l’area 
di un cerchio di raggio 1 è eguale alla 
metà della sua circonferenza. Vedia¬ 
mo in che senso nella teoria di Robin¬ 
son il ragionamento di Cusano è cor¬ 
retto. Dal momento che disponiamo di 
numeri infiniti e infinitesimi (nell’uni¬ 
verso non-standard), si può dimostrare 
che l’area del cerchio è la parte stan¬ 
dard della somma (nell’universo non¬ 
standard) di un numero infinito di in¬ 
finitesimi. 

Vediamo ora che forma assumereb¬ 
be il problema della caduta della pie¬ 
tra secondo le idee di Robinson. Defi¬ 
niamo la velocità istantanea non come 
il rapporto di incrementi infinitesimi, 
come faceva de l’Hòpital, ma piutto¬ 
sto come la parte standard di tale rap¬ 
porto; allora ds, dt e il loro rapporto 


ds/dt sono numeri reali non-standard. 
Come prima abbiamo ds/dt = 9,8 + 
4,9 dt, ma ora immediatamente con¬ 
cludiamo, rigorosamente e senza alcu¬ 
na restrizione, che v, parte standard di 
ds/dt è eguale a 9,8. Una lieve modifi¬ 
cazione del metodo degli infinitesimi di 
Leibniz, cioè la distinzione precisa tra 
il numero non-standard ds/dt e la sua 
parte standard v, elimina la contrad¬ 
dizione, che l’Hòpital semplicemente 
ignorava. 

Naturalmente, si richiede la dimo¬ 
strazione del fatto che la definizione di 
Robinson dia il medesimo risultato di 
quella di Weierstrass. Tale dimostra¬ 
zione non presenta difficoltà, ma non è 
il caso di darla qui. 

Ciò che si è ottenuto è che il meto¬ 
do infinitesimale è stato reso preciso 
per la prima volta. Nel passato i mate¬ 
matici dovevano fare una scelta. Se 
usavano infinitesimi, dovevano basarsi 
sull’esperienza e sull’intuizione per ra¬ 
gionare correttamente. « Andate avan¬ 
ti - cosi si suppone che Jean Le Rond 
d’Alembert avesse rassicurato un ami¬ 
co matematico esitante - e la fede vi 
verrà. » Per una rigorosa certezza era 
stato necessario ricorrere all’ingom¬ 
brante metodo archimedeo di esaustio- 
ne o alla sua versione moderna, il me¬ 
todo epsilon-delta di Weierstrass. Ora 
il metodo degli infinitesimi, o più in 
generale il metodo delle monadi, si ele¬ 
va dal livello euristico a quello rigoro¬ 
so. L’approccio dal punto di vista del¬ 
la logica formale permette di risponde¬ 
re compiutamente alla questione solle¬ 
vata da Berkeley e dagli altri protago¬ 
nisti delle controversie del passato, cioè 
se le quantità infinitesime esistono o no 
in qualche senso oggettivo. 

| e applicazioni che abbiamo discusso 
in questa sede sono elementari, ad¬ 
dirittura banali. Si sono fatte e si stan¬ 
no facendo applicazioni non banali. 
Sono stati pubblicati lavori sulla dina¬ 
mica non-standard e sulla probabilità 
non-standard. Robinson, e il suo allie¬ 
vo Alien Bernstein, han fatto uso di 
analisi non-standard per risolvere un 
problema - precedentemente insoluto - 
riguardante operatori lineari compatti. 
Si deve nondimeno dire che molti ana¬ 
listi restano scettici a proposito della 
importanza ultima del metodo di Ro¬ 
binson. È del tutto vero che ogni cosa 
che può esser fatta con gli infinitesimi 
può, in linea di principio, esser fatta 
senza di essi. Eorse, come per altre ra¬ 
dicali innovazioni, un uso esaustivo del¬ 
le nuove idee sarà fatto da una nuova 
generazione di matematici, non tanto 
immersi nei metodi standard da non 
poter godere della libertà e delle am¬ 
pie possibilità dell’analisi non-standard. 
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Nuovi modelli 

del sistema dei numeri reali 

E passato solo un secolo da quando i matematici hanno elaborato una 
sistemazione logica soddisfacente della nozione di numero reale; le 
indagini successive hanno però già portato alla luce problemi nuovi 

di Gabriele Lolli 


S ono trascorsi più di duemila anni 
dall’epoca in cui i pitagorici erano 
costretti a tenere nascosta la sco¬ 
perta dell’esistenza di grandezze incom¬ 
mensurabili. Oggi i sistemi numerici, 
che sono uno strumento quotidiano in¬ 
dispensabile in ogni campo della scien¬ 
za, conservano solo in qualche locuzio¬ 
ne (come quella dei numeri immagina¬ 
ri, o impossibili), una traccia di antiche 
difficoltà; ma non tutti sanno che que¬ 
sta conquista del pensiero moderno ha 
una data molto recente. Solo nel 1872 
i matematici sono infatti riusciti a e- 
laborare una sistemazione logica sod¬ 
disfacente della nozione di numero rea¬ 
le. Eppure le indagini posteriori, mai 
interrotte, su questa fondazione dell’in¬ 
tero edificio delle matematiche, hanno 
contribuito a portare alla luce proble¬ 
mi nuovi. 

Un’ importante svolta si è avuta nel 
1963 nella teoria degli insiemi, in seguito 
ai risultati di Cohen (si veda l’articolo La 
teoria non cantonana degli insiemi di P, 
J. Cohen e R. Hersh in questo volume) 
che riusciva a provare l’impossibilità di 
risolvere, nella teoria degli insiemi, 
questioni essenziali per la caratterizza¬ 
zione del sistema dei numeri reali. Nel 
presentare la situazione della discipli¬ 
na, servendosi di una analogia con la 
evoluzione delle geometrie non eucli¬ 
dee, Cohen e Hersh la definivano co¬ 
me « il periodo della elaborazione di 
teorie non standard », in alternativa tra 
loro, riservando al futuro il responso 
sulle possibili applicazioni dei frutti di 
queste ricerche. 

Un primo risultato del lavoro svolto 
negli ultimi anni è il perfezionamento 
delle tecniche usate per costruire mo¬ 
delli diversi della teoria. Per vedere al¬ 
l’opera tali tecniche, non è necessario 
considerare la teoria degli insiemi nel 
suo complesso, e non è neppure conve¬ 


niente: è innegabile che rappresentarsi 
modelli alternativi di una teoria che 
dovrebbero esprimere le proprietà del¬ 
l’intero universo degli oggetti matema¬ 
tici sia un’operazione psicologicamente 
e logicamente problematica. È suffi¬ 
ciente però considerare la più semplice 
teoria dei numeri reali, presentata non 
come una parte della teoria degli in¬ 
siemi, ma con una assiomatizzazione 
indipendente; vedremo tuttavia che 
non è possibile enunciare gli assiomi 
che caratterizzano i numeri reali sen¬ 
za far intervenire quelle costruzioni in¬ 
tellettuali che permettono ai nuovi me¬ 
todi di scattare e di produrre modelli 
alternativi. 

Descriveremo quindi una tecnica che 
permette di costruire un modello par¬ 
ticolarmente interessante per i suoi le¬ 
gami con la nozione di probabilità. Ta¬ 
le modello è profondamente diverso 
dal modello intuitivo dei numeri reali 
costituito dalla retta euclidea. Questa 
situazione appare contraddire non so¬ 
lo la comune sensazione che i numeri 
reali siano qualcosa di ben definito e 
assoluto, ma anche un teorema di uni¬ 
cità (dei modelli della teoria, come ve¬ 
dremo più avanti), che gli studenti im¬ 
parano a dimostrare e che è giusto, co¬ 
me ora sappiamo, solo in un senso 
piuttosto sofisticato. 

Cominceremo comunque riassumen¬ 
do nel paragrafo che segue la teoria 
classica dei numeri reali. 

T 'insieme dei numeri reali, che indi- 
■*-' cheremo con R, contiene i numeri 
naturali, i numeri interi relativi, i nu¬ 
meri razionali e i numeri irrazionali. I 
numeri naturali (0, 1, 2, ...) sono quel¬ 
li che servono per contare. Gli interi 
relativi e i razionali si ottengono am¬ 
pliando successivamente il sistema ori¬ 
ginario dei numeri naturali affinché si 


possano eseguire la sottrazione e, ri¬ 
spettivamente, la divisione, operazioni 
inverse delle due operazioni fondamen¬ 
tali : addizione e moltiplicazione. Pensia¬ 
mo che il lettore sia familiare con il siste¬ 
ma dei numeri razionali, che indichere¬ 
mo con Q, ma, per comodità, riassumia¬ 
mo nella figura della pagina a fronte 
la definizione più comune dei successi¬ 
vi ampliamenti che portano ai numeri 
razionali. Non si tratta di una succes¬ 
sione storica (perché la storia di questi 
sistemi di numeri non è affatto linea¬ 
re), ma di una successione logica, da 
cui si vede che occorrono solo opera¬ 
zioni insiemistiche semplici, oltre alla 
nozione di base di numero naturale, 
per definire il sistema Q. I numeri ra¬ 
zionali possono essere scritti sia come 
frazioni, sia con la rappresentazione 
decimale, limitata o periodica. 

La rappresentazione più comune dei 
numeri irrazionali è invece quella dei 
decimali illimitati non periodici, e un 
momento di riflessione mostra che in 
questa locuzione si nascondono con¬ 
cetti più complessi dei precedenti. Un 
decimale illimitato lo si pensa di solito 
come una successione di decimali limi¬ 
tati, e quindi di numeri razionali: quel¬ 
li che si ottengono, per ogni n, pren¬ 
dendo i primi n termini della succes¬ 
sione. Cosi u si identifica con la suc¬ 
cessione 3, 3,1, 3,14, ... . Questa im¬ 
magine si accorda sia con la definizio¬ 
ne rigorosa, sia con la pratica dell’uso 
dei numeri reali nelle misurazioni. 

Fino al secolo scorso, i matematici 
si distinguevano secondo due tenden¬ 
ze, nella considerazione dei numeri 
reali. Una di tipo assiomatico, risalen¬ 
te al calcolo dei rapporti di Eudosso 
(IV secolo a.C.), che più che dei nu¬ 
meri parlava del confronto di grandez¬ 
ze; una di tipo pratico-calcolistico, che 
si accontentava di postulare la possibi- 
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lità di eseguire misurazioni di qualsia¬ 
si lunghezza con l’approssimazione vo¬ 
luta, mediante i numeri razionali. Si 
consideri l’esempio classico di numero 
irrazionale, quello che, stando alla tra¬ 
dizione, fu il primo esempio di una 
lunghezza non misurabile con un nu¬ 
mero razionale: la lunghezza della dia¬ 
gonale di un quadrato di lato unitario 
che, per il teorema di Pitagora, indi¬ 
chiamo con y[2 . La dimostrazione che 
tale « numero » non è razionale è faci¬ 
le e nota. È possibile tuttavia appros¬ 
simare la lunghezza della diagonale 
mediante numeri razionali, con misu¬ 
razioni sempre più accurate, in modo 
che l’errore sia piccolo a piacere. Per 
esempio la successione, di numeri ra¬ 
zionali, definita per ricorsione 
b a = 2 ,bi= bJ2 + 1 lb a , ..., b n+l = 
= bj2 + l/b„ 

(i cui primi termini sono 2, 3/2,17/12, 
...), è una successione decrescente e tale 
che b 2 „ tende a 2 (si veda la figura in bas¬ 
so a pagina 44). Questo significa che, co¬ 
munque si prefissi un «errore» l/m, 
si può determinare un indice n a della 
successione tale che di li in avanti, cioè 
per ogni n > n a , si abbia 

2 < b\ < 2 + l/m 

Se la successione dei numeri b 2 „ 
tende, o converge, al limite 2, ci si 
aspetta che la successione dei numeri 


b n converga a V~2; in effetti si può 
dimostrare che non può convergere né 
a un numero il cui quadrato sia mino¬ 
re di 2, né a un numero il cui qua¬ 
drato sia maggiore di 2. Ne segue che, 
in Q, la successione, che indicheremo 
con {b n }, non è convergente. 

I numeri razionali formano un si¬ 
stema soddisfacente, per quel che ri¬ 
guarda le manipolazioni con le opera¬ 
zioni algebriche; formano, come si di¬ 
ce, un corpo ordinato (si veda la figu¬ 
ra a pagina 45). Quello che manca è 
la validità del postulato pratico che a 
ogni grandezza lineare si possa associa¬ 
re un numero come misura e che, in 
termini matematici, si può formulare 
dicendo che successioni di numeri del 
tipo di quella esaminata sopra devono 
convergere a qualche numero. Il siste¬ 
ma dei razionali deve essere completa¬ 
to riempiendo, in un certo senso, le la¬ 
cune che le successioni di questo tipo 
rivelano. Ma quale è la caratteristica di 
queste successioni a cui deve essere as¬ 
sociato un limite? Occorre avere un cri¬ 
terio interno alle successioni, una pro¬ 
prietà che si possa stabilire esaminando 
solo i termini della successione e nes¬ 
sun elemento estraneo. Georg Cantor 
(1845-1918), perfezionando il preceden¬ 
te lavoro di Cauchy sulle successioni, 
propose nel 1872 di assumere come cri¬ 


terio la cosiddetta condizione di Cau¬ 
chy: una successione { b n } soddisfa que¬ 
sta condizione, ed è detta allora fonda- 
mentale (o successione di Cauchy), se 
al crescere dell’indice n i termini della 
successione diventano arbitrariamente 
vicini tra loro. Più esattamente, fis¬ 
sata comunque una «distanza» l/m, 
si può determinare un indice n 0 al di 
là del quale (cioè per tutti gli indici 
p e q maggiori di n a ) si abbia 
\b p -b q \< l/m. 

Scelto questo criterio, la natura dei 
nuovi enti da associare alle successio¬ 
ni di Cauchy non è un problema; essi 
possono essere identificati con le suc¬ 
cessioni stesse, tra cui si possono defi¬ 
nire le operazioni eseguendole termine 
a termine. La somma delle due succes¬ 
sioni {b n ) e {c„} è la successione 
{ b n + c n }, e cosi via. L’insieme dei 
nuovi enti contiene una copia esatta 
dei numeri razionali, perché ogni nu¬ 
mero razionale si può identificare con 
la successione costante i cui termini 
sono tutti uguali al numero dato. C’è 
una complicazione, dovuta al fatto che 
successioni diverse possono tendere al¬ 
lo stesso limite; allora bisogna « iden¬ 
tificare » tra loro tutte le successioni 
la cui differenza tende a zero; questa 
operazione, detta passaggio al quozien¬ 
te, è frequentissima in matematica, ed 


NUMERI NATURALI 

0, 1, 2.n, 


NUMERI INTERI RELATIVI 


. . . ; — 2 , — 1 , 0 , + 1 , + 2 , . . . 


I numeri interi relativi si possono definire a partire dai numeri naturali nei seguente modo. Si considerino tutte le coppie ordinate (m, n) 

di numeri naturali; intuitivamente, la coppia (m, n) rappresenterà il numero relativo m — n. Tra queste coppie si definiscano le opera¬ 

zioni in questo modo: (m, n) + (p, q) = (m + p, n + q), (m, n) . (p, q) = (m • p + n . q, m • q + n . p). Le definizioni rifletto¬ 
no quello che si fa in pratica per sommare e moltiplicare i due numeri m — n e p — q; due coppie (m, n) e (p, q) rappresentano lo 
stesso numero se m + q = p + n. In termini più precisi la relazione (m, n) R (p, q) se e solo se m + q = p + n è una relazione 

di equivalenza, e i numeri interi relativi si ottengono identificando tutte le coppie tra loro equivalenti; i numeri interi positivi sono quel¬ 

li rappresentati da coppie dei tipo (m, 0) e quelli negativi da coppie del tipo (0, m). 


NUMERI RAZIONALI 

1 = 0,5 ; ^ = 1,333 . . . = 1Ì3 


I numeri razionali, o frazioni, si possono definire a partire dai numeri interi relativi nel seguente modo. Si considerino tutte le coppie or- 

x 

dinate (x, y)' di numeri interi, con y ^ 0; il simbolo (x, y) sarà poi sostituito da quello più corrente —. Tra queste coppie si definiscano 


le operazioni nel modo seguente, che non è altro se non quello che si fa nella pratica per calcolare con le frazioni: (x, y) + (u, v) = 
(x.v + y.u. y • v) e (x, y) . (u, v) = (x .u, y . v). La coppia (0, 1) diventa lo zero dei razionali e (1, 1) l’unità. I numeri interi, contenuti 
nei razionali, sono le coppie (x, 1). Esistono coppie diverse che intuitivamente rappresentano Io stesso numero. Noi consideriamo come la 


«stessa» frazione una qualunque delle frazioni , 


In termini più precisi, questo significa che la relazione 


(x, y) R (u, v) se e solo se x ■ v — y.u = 0 

è una relazione di equivalenza e che i numeri razionali si ottengono identificando tutte le coppie tra loro equivalenti. Come 
rappresentante di ciascuna di queste classi si può prendere una coppia qualunque che stia nella classe, di solito quella che noi chia¬ 
miamo frazione ridotta ai minimi termini. 


Il passaggio dai numeri naturali ai numeri interi e quindi ai ra- identificazione per equivalenza) proposto nella prima metà del 

zionali può essere giustificato con il «metodo delle coppie» (e secolo XIX dal matematico irlandese William Rowan Hamilton. 
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Una relazione di equivalenza R tra gli elementi di un insieme X è una relazione ri¬ 
flessiva (LRa;), simmetrica (xRy—»yRx) e transitiva (zRy & yRz —> ;cRz). Se uniamo con 
delle frecce gli elementi che si corrispondono nella relazione R, il grafico della rela¬ 
zione risulta allora formato da cicli chiusi e disgiunti come nella figura a, dove abbia¬ 
mo trascurato le frecce che partono e arrivano a uno stesso elemento. Fare il quozien¬ 
te dell’insieme X rispetto alla relazione di equivalenza R significa sostituire un unico 
oggetto a ciascuno di questi cicli, come in figura b. Se per esempio si considera la re¬ 
lazione di equivalenza « vivere nello stesso appartamento » la figura a può rappresen¬ 
tare tre famiglie che abitano in appartamenti distinti e la figura b rappresenta inve¬ 
ce gli appartamenti stessi. Quelli che abbiamo chiamato cicli vengono detti più propria¬ 
mente, in linguaggio tecnico, classi di equivalenza, e un qualsiasi elemento di una clas¬ 
se si dice rappresentante della classe; nel nostro esempio, uno qualunque dei membri 
di ciascuna famiglia. Il passaggio al quoziente si esegue quando le operazioni o i ra¬ 
gionamenti che si devono fare non dipendono dalla scelta del rappresentante delle 
classi; si può anche scegliere un rappresentante da ogni classe e cancellare gli altri. 


è già presente nella definizione dei nu¬ 
meri razionali (si veda l’illustrazione 
alla pagina precedente e qui sopra). 

Non è il caso di impegnarsi in tutti i 
particolari della definizione di R; due 
osservazioni sono importanti, sul risul¬ 
tato finale di questa costruzione: da 
una parte si può dimostrare la possibi¬ 



lità di associare a ogni numero reale 
la solita rappresentazione decimale, e 
si può lavorare tranquillamente come 
si è sempre fatto; dall’altra R risulta 
un’estensione completa di Q nel se¬ 
guente senso: le successioni di numeri 
reali che soddisfano alla condizione di 
Cauchy convergono a numeri reali. 



Dunque R non si può più estendere 
con il procedimento descritto, né c’è 
bisogno di farlo. 

Le proprietà essenziali dei numeri rea¬ 
li, quelle algebriche e quella della com¬ 
pletezza, si possono esplicitare in una li¬ 
sta finita di assiomi. Nella figura della pa¬ 
gina a fronte sono elencati questi assio¬ 
mi, che caratterizzano i cosiddetti cor¬ 
pi ordinati continui; la condizione del¬ 
la completezza, che abbiamo discusso 
prima, è ivi formulata in termini di¬ 
versi: ogni insieme limitato superior¬ 
mente ha un minimo confine superio¬ 
re. Questa versione si può dimostrare 
equivalente alla precedente, e deriva 
più direttamente da un’altra definizio¬ 
ne dei numeri reali, proposta nello 
stesso 1872 da Richard Dedekind 
(1831-1916). Egli osservò che la pro¬ 
prietà di continuità che noi associa¬ 
mo alla retta si può esprimere nel 
seguente modo: se dividiamo l’inte¬ 
ro sistema di punti in due classi, in 
modo che ogni punto cada in alme¬ 
no una delle due classi e tutti i pun¬ 
ti di una classe precedano tutti quel¬ 
li della seconda (nell’ordine intuiti¬ 
vo da sinistra verso destra), allora c’è 
uno ed un solo punto che funge da 
elemento separatore delle due classi, 
nel senso che è il massimo della prima 
o il minimo della seconda. Nel sistema 
dei numeri razionali questo non è 
sempre vero, come si vede se si consi¬ 
dera la sezione che mette in una clas¬ 
se tutti i numeri il cui quadrato è mi¬ 
nore di 2, e nell’altra tutti i restanti. 
Una estensione di Q che abbia questa 
proprietà si può ottenere identificando 
i nuovi numeri con le sezioni stesse 
dell’insieme Q e definendo opportuna¬ 
mente le operazioni. Il risultato è un 
sistema di enti che soddisfa tutti gli as¬ 
siomi dei corpi ordinati continui, che 
è logicamente definito solo usando la 
nozione di classe, o proprietà, dei nu¬ 
meri razionali e che si presenta come 
la realizzazione di quella che intuiti¬ 
vamente pensiamo essere la retta. 

Le due strutture che abbiamo co¬ 
struito, una con le successioni fonda- 
mentali, l’altra con le sezioni di Dede¬ 
kind, sono due modelli diversi degli as¬ 
siomi dei corpi ordinati continui. Ma 
nonostante gli oggetti che costituisco¬ 
no le strutture, da una parte le succes¬ 
sioni, dall’altra le sezioni, siano diver¬ 
si, i due modelli sono sostanzialmente 
la stessa cosa; in matematica questa af¬ 
fermazione si precisa dimostrando che 
sono isomorfi (si veda la figura a pagina 
47). Si può anzi dimostrare di più: due 
corpi ordinati continui qualunque so¬ 
no isomorfi. Questo è il teorema di 
unicità che avevamo annunciato: il 


Una successione di numeri razionali che converge a 7 2 decrescendo (approssimazio¬ 
ni per eccesso) si può ottenere con il cosiddetto metodo delle tangenti (a). Fissato il 
punto 6 0 = 2, si conduce la tangente alla curva y = x 1 — 2 nel punto (2,2) e si indivi¬ 
dua l’ascissa b\ = 3/2 in cui essa incontra l’asse delle x ; quindi si ripete il procedi¬ 
mento partendo dal punto (3/2, 1/4), e cosi via. Nei corsi di calcolo infinitesimale si 
dimostra che tale successione è definita dalla formula ricorrente 6„ + , = (l/2)6„ -f 1/6,„ 
e che converge al punto in cui x7 •—-2 = 0. Una successione di numeri razionali che 
converge a f2 crescendo (approssimazioni per difetto) si può ottenere con il cosid¬ 
detto metodo delle corde (6). (I disegni a e b sono in scala diversa perché la figura 
risulti più chiara). Fissato il punto b a = 1, si conduce la corda che unisce i punti 
(1> •—1) e (2,2) e si individua l’ascissa 6 ( == 4/3, in cui essa incontra l’asse delle x; 
quindi si ripete il procedimento con i due punti (4/3, — 2/9) e (2,2), e cosi via. Si 
dimostra che tale successione è definita dalla formula ricorrente Z>„ + , = (4 + 2b„- —26 2 „) / 
/ (4—■ b 2 „) e che converge a f2. Le due successioni convergenti a 'fi rappresentano 
Io stesso numero reale, se questi sono definiti per mezzo delle successioni di Cauchy. 
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1. PROPRIETÀ ASSOCIATIVA DELLA ADDIZIONE E DELLA MOLTIPLICAZIONE 

V x V y V z [(x + y) + z = x + (y + z)] 

V x V y V z [(x . y) . z = x . (y . z)] 


2. PROPRIETÀ COMMUTATIVA DELLA ADDIZIONE E DELLA MOLTIPLICAZIONE 

VxVy(x + y = y + x) ; VxVy(x.y = y.x) 


3. ESISTENZA DEGLI ELEMENTI NEUTRI 

V x (x + 0 = x) ; V x (x . 1 = x) ; 0^1 


4. ESISTENZA DEGLI INVERSI 

Vx3y(x + y = 0) ; V x (x ^ 0 -> 3 y (x ■ y = 1)) 


5. PROPRIETÀ DISTRIBUTIVA 

VxVyVz[x-(y + z) = x.y + x.z] 


6. PROPRIETÀ DELL’ORDINE 

VxVyVz(x<y&y<z-*x<z) 
VxVy(x<yVx = yVy<x) 
VxVyVz(x<y-*x + z<y + z) 
VxVyVz(x<y&0<z->x-z<y.z) 


7. CONTINUITÀ 

VS[3yVx(XES->x<y)-*3 y¥z(y z <—» V x (x e S ->x ^ z)] 


Gli assiomi che caratterizzano i numeri reali sono scritti nel 
linguaggio simbolico che è comunemente usato in matematica: 
Vx... si legge: per tutti gli x... ; 3x... : esiste un x tale 
che...; V : oppure ; & : e ; —> : implica ; <=—» : se e solo se ; 
co : non ; x < y : x è minore di y ; x ^ y : x<yVx = y; 
x E S : x è un elemento di S o x appartiene a S. Un insieme 
X in cui siano definite due operazioni, indicate con + e • , e 
una relazione < , e che contenga due elementi particolari 0 e 1 
si indica < X, +,-,<, 0,1 >. Se le operazioni -j- e • soddisfano 
le proprietà da 1 a 5 si dice che < X, +,-,<, 0,1 > è un 
corpo commutativo. Se inoltre sono vere le proprietà dell’ordine 
6. si dice che è un corpo ordinato. Se è vero anche l’assioma 


di continuità, quando si interpretino le lettere maiuscole come 
sottoinsiemi di X, si dice che è un corpo ordinato continuo. 
L’assioma di continuità afferma che se un insieme è limitato 
superiormente, allora esiste un numero che è il piu piccolo di 
tutti i maggioranti, e che si chiama minimo confine superiore, 
o estremo superiore, e si indica con sup(S). Con inf(S) si indica 
il più grande dei numeri che sono minori di tutti gli elementi 
di S, o estremo inferiore. L’assioma di continuità implica anche 
che, se un insieme è limitato inferiormente, allora esiste l’estre¬ 
mo inferiore. La costruzione dei numeri reali dai razionali ri¬ 
cordata nel testo si può generalizzare a corpi ordinati qualun¬ 
que, che soddisfino un’ulteriore proprietà, detta di Archimede. 


completamento dei razionali è unico. 

Quando tutti i modelli di un siste¬ 
ma di assiomi sono isomorfi, noi asso¬ 
ciamo agli assiomi un unico concetto 
ben definito, per esempio quello dei 
numeri reali, e i singoli modelli non 
sono altro che raffigurazioni intuitive 
diverse di tale concetto. Ecco perché 
possiamo parlare dell’insieme R dei 
numeri reali, senza precisare come sia 
stato costruito R. Questo non succede 
con tutti i sistemi di assiomi; per esem¬ 
pio, sia Q, sia R, sono corpi ordinati, 
ma non sono isomorfi. È l’assioma di 
continuità che, tra tutti i possibili cor¬ 
pi ordinati, opera una selezione, dopo 
la quale rimangono soltanto delle strut¬ 
ture isomorfe tra loro. 

Qome è possibile allora che Cohen ab¬ 
bia costruito dei sistemi di numeri 
reali di cardinalità diversa, e quindi in 
particolare non isomorfi? Anche se non 


possiamo esaminare la dimostrazione 
del teorema di unicità, dobbiamo dire 
che la spiegazione è da ricercarsi nel¬ 
la particolare natura dell’assioma di 
continuità. L’assioma fa riferimento a 
tutti i possibili sottoinsiemi di R; si dice 
anche che è formulato nella logica del 
secondo ordine, mentre gli altri assio¬ 
mi, che parlano soltanto degli elemen¬ 
ti di R, richiedono la più semplice logi¬ 
ca del primo ordine. Per poter fare un 
qualsiasi ragionamento, abbiamo biso¬ 
gno di criteri logici che regolino l’uso 
di questa nozione della totalità di tut¬ 
ti i sottoinsiemi di un insieme infinito. 
Tali criteri, una volta esplicitati, non 
sono altro che proprietà dell’universo, 
codificate negli attuali assiomi della 
teoria degli insiemi. Ogni teorema che 
segua da questi assiomi, o da un ragio¬ 
namento che ne faccia tacitamente uso, 
sarà vero nell’universo. Il fatto è che 
non è possibile caratterizzare in modo 


unico l’universo degli insiemi per mez¬ 
zo di un sistema assiomatico del tipo 
di quelli in uso; ciò significa che è pos¬ 
sibile definire delle totalità differenti 
tra loro, ma in cui sono ugualmen¬ 
te vere tutte le proprietà che abbiamo 
codificato negli assiomi. Gli universi 
in particolare differiscono nel numero 
di sottoinsiemi degli insiemi infiniti che 
contengono. Può allora succedere che, 
se anche il teorema di unicità è vero 
in ogni universo (perché discende da¬ 
gli assiomi), corpi ordinati continui 
presenti in universi diversi non sono 
isomorfi tra loro. 

Fino a che non si riuscirà a carat¬ 
terizzare un unico universo degli insie¬ 
mi, si potranno stabilire solo dei risul¬ 
tati validi nei singoli universi possibili, 
ma non in assoluto. 

Ma c’è anche un altro senso in cui 
il teorema di unicità può venir meno, 
senso che si può cogliere affinando 
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l’uso della logica e ridefinendo la no¬ 
zione di modello di un sistema di as¬ 
siomi. Si tratta di introdurre i cosid¬ 
detti modelli non standard, di cui non 
daremo la definizione generale, ma un 
esempio relativo appunto alla teoria 
dei numeri reali. Bisogna però ricor¬ 
dare che la tecnica usata è una elabo¬ 
razione di quelle applicate originaria¬ 
mente alla teoria degli insiemi. 

Il nostro punto di partenza è l’os¬ 
servazione che nella pratica scientifica 
si incontrano degli enti che sono usati 
come se fossero numeri reali, pur es¬ 
sendo in realtà qualcosa di molto più 
complicato: si tratta delle variabili ca¬ 
suali (o aleatorie) su uno spazio di 
probabilità. La precisazione di questo 
concetto e del suo uso ci condur¬ 
rà in modo naturale alla definizio¬ 
ne di un modello non standard dei 
numeri reali. Variabile casuale è già 
un nome più sofisticato per altri, co¬ 
me elemento aleatorio, di uso comu¬ 
ne; si dice di solito che una varia¬ 
bile casuale è « una quantità i cui; 

; valori sono determinati dal caso ». Con - 
ciò si intende che dei valori numerici 
vengono associati al risultato di un 
esperimento, esperimento il cui esito 
può a priori variare in un certo cam¬ 
po. Con esperimento si intende o una 
prova guidata, come il lancio di un da¬ 
do (non truccato), o una situazione 
osservabile, per esempio una certa 
configurazione degli elementi atmosfe¬ 
rici. I valori associati ai risultati del¬ 
l’esperimento potrebbero essere, nei 
due esempi, o dei punteggi di scom¬ 
messe o, rispettivamente, dei valori 
della temperatura o della pressione. 
Questi valori sono poi manipolati 
in operazioni, relazioni, previsioni, co¬ 
me se fossero dei numeri, e in real¬ 
tà lo sono, ma dipendono dal caso. 
Questo significa che dobbiamo valuta¬ 
re, e portarci dietro in qualche modo 
nei calcoli e nei ragionamenti, la pro¬ 
babilità che i valori siano quelli che 
manipoliamo. Quindi innanzi tutto 
dobbiamo valutare la probabilità che i 
risultati dell’esperimento siano o no di 
un certo tipo. Se l’esperimento è il 
lancio di un dado, tipiche situazioni 
possibili, cui devono essere assegnate 
delle probabilità, sono: « il risultato è 
un numero pari », « il risultato è un 
numero minore di 3 », e cosi via. A 
queste possibilità si dà il nome di even¬ 
ti. Dall’esempio citato si vede che gli 
eventi possono essere rappresentati da 
sottoinsiemi dell’insieme {1,2, 3, 4, 5, 6} 
di tutti i possibili risultati; i due even¬ 
ti menzionati, in particolare, dai sot¬ 
toinsiemi {2,4,6} e {1,2} rispettiva¬ 
mente, a cui sono assegnate le proba¬ 
bilità 1/2 e 1/3. 


Possiamo ora ricordare la definizio¬ 
ne di spazio di probabilità, associato a 
un esperimento. È dato un insieme X, 
l’insieme dei risultati possibili, e una 
famiglia <JE di sottoinsiemi di X che 
rappresentano gli eventi. Nelle situa¬ 
zioni più generali, non è necessario 
che contenga tutti i sottoinsiemi di 
X, ma deve essere chiusa rispetto a 
certe operazioni; analizzando l’uso co¬ 
mune del termine evento nella lingua 
di ogni giorno, locuzioni come « even¬ 
to opposto di un altro », « evento che 
risulta dalla combinazione di due even¬ 
ti » e simili, si vede che la famiglia de¬ 
gli eventi deve soddisfare queste con¬ 
dizioni: deve contenere X, l’evento 
certo, e, nel caso che E e E siano due 
eventi, anche la riunione EU E, l’in¬ 
tersezione EOE e il complemento 
X-E devono essere eventi. Inoltre, 
per poter parlare anche della ripetizio¬ 
ne indefinita di un esperimento, occor¬ 
re che, se {E,,} è una successione di 

OO 

eventi, anche la riunione U E„ sia un 

n = 1 

evento. Una famiglia di sottoinsiemi di 
X soddisfacente a queste condizioni si 
dice un a - corpo di insiemi in X (que¬ 
sto nella letteratura algebrica; in teo¬ 
ria delle probabilità si parla anche di 
tribù di insiemi). 

La probabilità degli eventi è ora sta¬ 
bilita da una funzione m, definita per 
tutti gli eventi, che assume valori 
reali compresi tra 0 e 1, e tale che 
m(X) = 1 e che se {E„} è una succes¬ 
sione di eventi a due a due disgiunti 
si abbia 

OO OO 

m ( U E„) = •£ m (E n ). 

n=l »=1 

Quest’ultima condizione è detta la ff- 
-additività. 

Una variabile casuale su uno spazio 
di probabilità < X,<Jt,m > non è altro 
che una funzione da X in R a propo¬ 
sito della quale abbia senso porre 
questioni di probabilità, e si possa 
decidere la probabilità che i valori 
della funzione cadano entro limiti pre¬ 
fissati. Per questo è sufficiente richie¬ 
dere che, se / è la funzione, per ogni 
numero reale r l’insieme degli elemen¬ 
ti x di X tali che / (x) < r, in simboli 
{xeX : f(x) < r} 

sia un evento, e quindi abbia una pro¬ 
babilità associata. 

Non possiamo discutere più a fondo 
la struttura degli spazi di probabilità e 
dei sistemi di variabili casuali associa¬ 
ti. D’altra parte il discorso che segue 
dipende solo dalle proprietà generali 
di questi sistemi, comuni a tutti; po¬ 
tremmo dire che dipende solo dalle de¬ 
finizioni, come è tipico dei ragiona¬ 
menti matematici. Le conclusioni a cui 
perverremo avranno allora anch’esse 


un carattere molto generale, perché 
non dipenderanno dal particolare spa¬ 
zio di partenza. Dobbiamo solo avver¬ 
tire che gli spazi più interessanti non 
sono quelli legati all’esperimento del 
dado, ma sono quelli infiniti. 11 lettore 
può pensare che X sia l’insieme dei 
numeri reali compresi tra 0 e 1, e i 
la famiglia dei cosiddetti insiemi di Bo¬ 
rei: la famiglia che si ottiene partendo 
dagli intervalli contenuti in X e iteran¬ 
do le operazioni di riunione (anche di 
successioni di insiemi) e di complemen¬ 
to. La misura m in questo caso è la 
cosiddetta misura di Borei: gli inter¬ 
valli hanno come misura la loro am¬ 
piezza, e gli altri insiemi di Borei una 
misura che si ottiene in modo natura¬ 
le calcolandola a partire da quella de¬ 
gli intervalli che sono alla base della 
loro costruzione. In questo caso gli 
eventi che sono composti di un solo 
punto hanno misura zero, o nulla. 

J^opo aver definito esattamente la no¬ 
zione di variabile casuale, dobbia¬ 
mo ancora approfondire la compren¬ 
sione del loro uso. Come abbiamo già 
spiegato, quando diciamo che le varia¬ 
bili casuali sono numeri reali che di¬ 
pendono dal caso intendiamo dire che 
in tutte le operazioni (logiche o di cal¬ 
colo) che eseguiamo con i valori delle 
variabili casuali, ci dobbiamo portare 
dietro la valutazione della probabilità 
che i valori risultanti dall’esperimento 
siano quelli su cui operiamo. Ne segue 
che tutte le proposizioni concernenti 
un sistema di variabili casuali sono 
dei giudizi di probabilità, e che la di¬ 
cotomia vero-falso mal si adatta in 
questo caso alla natura degli oggetti in 
questione. 

Consideriamo un esempio semplice, 
per quanto artificioso: se / è la varia¬ 
bile connessa al lancio di un dado, che 
vale 0 se il risultato del lancio è 1, e 
1 in tutti gli altri casi, mentre g è la 
variabile che vale 0 se il risultato è 6, 
e 1 in tutti gli altri casi, le due varia¬ 
bili sono diverse, ma questo giudizio è 
scarsamente informativo; maggiore in¬ 
formazione si ha dall’osservazione che 
c’è una buona probabilità che / e g sia¬ 
no uguali, e precisamente 2/3, corri¬ 
spondente all’evento {2, 3, 4, 5}. 

Da questo esempio si vede come, at¬ 
tribuendo alle proposizioni concernen¬ 
ti un sistema di variabili casuali dei 
valori di probabilità, da una parte si è 
più fedeli allo spirito delle questioni 
che si trattano, dall’altra si arricchi¬ 
scono le possibilità di giudizio: alcune 
proposizioni avranno valore 1 e saran¬ 
no dette valide, altre avranno valore 0 
e saranno dette false, altre infine 
avranno solo una certa probabilità po- 
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sitiva, che non è uguale alla certezza. 

In queste osservazioni non c’è nulla 
di nuovo rispetto a quello che si fa 
nella pratica quando si calcolano le 
probabilità di eventi complessi. Dob¬ 
biamo solo descrivere come si fa ad 
assegnare queste probabilità, in modo 
sistematico, a tutte le proposizioni con¬ 
cernenti un dato sistema di variabili 
casuali e in modo da rispettare la cor¬ 
rettezza dei ragionamenti. Se non ha 
senso dire che una affermazione sulle 
variabili casuali è vera o falsa, ha sen¬ 
so invece controllare la correttezza dei 
ragionamenti e dei calcoli; questo non 
significa che l’implicazione dalle pre¬ 
messe alla conclusione è vera, ma che 
la probabilità di una conclusione non 
deve essere inferiore a quella delle pre¬ 
messe. Si tenga presente poi che con 
questa valutazione probabilistica delle 
proposizioni dobbiamo anche dare un 
senso preciso e giustificare l’afferma¬ 
zione che le variabili casuali possono 
essere trattate come numeri reali. 

Per la realizzazione di questo com¬ 
pito, il « mestiere » logico ci suggeri¬ 
sce alcune semplificazioni. Supponiamo 
di aver fissato uno spazio di probabili¬ 
tà < X, <A, m > e l’insieme 'K delle 
variabili casuali su X. Se ci limitiamo 
a considerare le proposizioni sugli ele¬ 
menti di <1Z che sono analoghe alle 
proposizioni sui numeri reali, possia¬ 
mo delimitare in modo preciso la clas¬ 
se di queste proposizioni. Ci sono in¬ 
nanzitutto le proposizioni elementa¬ 
ri, o atomiche, del tipo / = g, f < g, 
f + g = h, f ■ g = h, dove /, g, h so¬ 
no elementi di C R. È chiaro che po¬ 


tremmo considerare anche altre propo¬ 
sizioni elementari, ma il linguaggio in 
cui abbiamo formulato gli assiomi dei 
numeri reali contempla solo proposi¬ 
zioni elementari di questo tipo. Poi ci 
sono le proposizioni più complesse, che 
si ottengono da quelle più semplici per 
mezzo dei connettivi logici: « non », 
«oppure» ecc., e dei quantificatori: 
« esiste un x tale che... », « per tutti 
gli x... » (si veda la figura a pagina 45). 

Assegneremo innanzitutto un valore 
alle proposizioni elementari, e poi 
faremo vedere, con un ragionamento 
induttivo, come si possa assegnare un 
valore alle proposizioni complesse am¬ 
mettendo di averlo già assegnato alle 
proposizioni più semplici. Per fare ciò, 
non è possibile assegnare direttamente 
dei semplici numeri, misure di proba¬ 
bilità, come valore delle proposizioni. 
È abbastanza spontaneo proporre, per 
esempio, che il valore della proposizio¬ 
ne / = g sia la misura dell’insieme 
[xzX : f (x) = g(x)} ma, se lavoria¬ 
mo solo con i numeri, andiamo incon¬ 
tro a difficoltà quando passiamo alle 
proposizioni complesse. Si consideri 
questo caso: il valore della proposizio¬ 
ne / = g & g = h deve essere minore o 
uguale a quello della proposizione 
/ = h, perché / = g & g = fi —> / = h è 
una legge logica dell’identità. Ma sia 
per esempio / la variabile, connessa al 
lancio di un dado, che vale 1 se il ri¬ 
sultato è pari e 0 se il risultato è di¬ 
spari, e g la variabile che vale 2 se il 
risultato è pari e 0 se il risultato è di¬ 
spari. Se h è la variabile che vale 3 se 


il risultato è pari e 0 se è dispari al¬ 
lora f = g, g = h e f = h hanno tutte 
probabilità 1/2; se h è la variabile che 
vale 2 se il risultato è pari e 1 se il ri¬ 
sultato è dispari, allora f = g e g = h 
hanno probabilità 1/2, mentre f = h 
ha probabilità 0. 

Questo esempio suggerisce che nel 
valutare le proposizioni non si può te¬ 
ner conto soltanto della probabilità de¬ 
gli eventi che esse descrivono, ma bi¬ 
sogna prendere in considerazione gli 
eventi stessi. Lungi dall’essere una com¬ 
plicazione, questa necessità si rivela 
decisamente semplificatrice. La fami¬ 
glia cX degli eventi infatti, con le sue 
operazioni insiemistiche di unione, in¬ 
tersezione e complemento, ha una 
struttura che è molto simile a quella 
dei sistemi logici astratti. Ha una strut¬ 
tura che è quasi un’algebra di Boole 
completa (si veda la figura a pagina 49). 
Diciamo quasi perché per ottenere 
proprio un’algebra di Boole occorre¬ 
rebbe prima identificare tra loro gli 
eventi la cui differenza è un evento di 
misura nulla; ma per non interrompe¬ 
re il filo dell’esposizione aggiriamo 
questo ostacolo e supponiamo che la 
famiglia degli eventi sia un’algebra di 
Boole. Ora è ben noto ai logici che per 
poter assegnare dei valori alle propo¬ 
sizioni del discorso in modo da ottene¬ 
re una valutazione sensata del ragiona¬ 
mento occorre e basta che tali valori 
siano strutturati in un’algebra di Boole. 
I due valori classici vero e falso costi¬ 
tuiscono soltanto la più semplice delle 
algebre di Boole. Con un’algebra di 
questo tipo, dopo aver assegnato dei 


UN SISTEMA DI ASSIOMI 

VxVy(x + y = y + x) 

V x (x + 0 = x) 

V x 3 y(x + y = 0) 

I simboli + e 0 non vanno intesi come la ordinaria addizione tra numeri e il numero 0, ma come simboli linguistici per una operazione 

binaria e un elemento neutro rispetto alla operazione. 


DUE MODELLI 


— 1 , 0,1 


1 

— . 1,2 

2 


In questo insieme di numeri interi si consideri l'addizione ordina¬ 
ria e lo zero svolga il ruolo di elemento neutro. I tre assiomi 
sono validi. 


In questo insieme di numeri razionali, si consideri la moltiplica¬ 
zione ordinaria e 1 svolga il ruolo di elemento neutro. I tre assiomi 
sono validi. 


I due modelli sono isomorfi. Questo significa che esiste una 
corrispondenza biunivoca f tra i due insiemi, che conserva le 
operazioni. Più esattamente : 1) a ogni elemento di un sistema 
corrisponde uno e un solo elemento dell’altro sistema, me¬ 
diante la /, e a due elementi distinti corrispondono elementi 
distinti; tutti gli elementi del secondo sistema corrispondono 
a qualche elemento del primo: / (— 1 ) = / ( 0 ) = 1 , / ( 1 ) = 


= 2 ; 2 ) all’elemento neutro corrisponde l’elemento neutro 
/ (0) = 1 ; 3) per ogni x, y e z, abbiamo x 4 - y = z nel primo 
sistema se e solo (/ (x) • / (y)) = / (z) nel secondo, e viceversa. 
Quando due strutture sono isomorfe, esse hanno in particolare la 
stessa cardinalità, anche se sono infinite; diciamo che due insiemi 
hanno la stessa cardinalità nel caso appunto che esista tra di essi 
una corrispondenza biunivoca, nel senso della condizione 1. 
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valori alle proposizioni elementari, si 
procederà cosi: se tp e <]> indicano del¬ 
le proposizioni di cui già conosciamo 
il valore, che scriveremo con [tp] e 
[4 1 ], i valori delle proposizioni compo¬ 
ste mediante <p e 4* si calcoleranno se¬ 
condo questo schema 

[<p & ip] = [<p] n [ip] 

[tp V v[] = [tp] u [4/] 

[~ 9] = [<p]' 

[3jc<p(x)] = U [<pW] 

X E « 

Ci si può limitare a questo tipo di pro¬ 
posizioni, perché gli altri connettivi 
possono essere eliminati, definendoli 
per mezzo di quelli elencati. Seguendo 
questo criterio di valutazione è noto, 
e si può verificare facilmente, che tut¬ 
ti gli assiomi della logica sono validi, 
hanno come valore PI dell’algebra di 
Boole, e che le conclusioni di un ragio¬ 
namento hanno valore maggiore o 
uguale a quello delle premesse. 

Come esempio si consideri il princi¬ 
pio di non contraddizione: ~ (tp & ~ tp). 
Abbiamo: 

[~ (q> & ~ tp)] = ([tp] fi [tp]')' = 0' = 1 
Per raggiungere l’obiettivo che ci era¬ 
vamo proposti, non resta allora che pre¬ 
cisare il valore da assegnare alle propo¬ 
sizioni elementari, e verificare che an¬ 
che gli assiomi dell’identità e gli assio¬ 
mi propri dei corpi ordinati risultano 
validi. Dopo quanto abbiamo anticipa¬ 
to, non v’è dubbio che il valore asse¬ 
gnato alle proposizioni elementari sarà 
l’evento stesso che essi descrivono: 

[/ = £] = {xzX : /(x) = g(x)} 

[/ + g - fi] = {xzX : f (x) + g (x) = 
= h(x)} 

e cosi via. 

Il sistema di valutazione adottato 
può sembrare un po’ astratto dal mo¬ 
mento che il valore di una proposizio¬ 
ne risulta essere l’evento da essa de¬ 
scritto, ma è sempre possibile, in un se¬ 
condo tempo, il passaggio dagli eventi 
alle loro probabilità, per cui è legitti¬ 
mo chiamare questa una valutazione 
probabilistica delle proposizioni. 

Ora possiamo verificare che, in sen¬ 
so probabilistico, le variabili casuali 
costituiscono un corpo ordinato. Esa- 
miniano solo i due assiomi in cui mag¬ 
giormente risalta la differenza tra la 
valutazione classica delle proposizioni 
e quella probabilistica. Perché un si¬ 
stema sia totalmente ordinato occorre 
che, presi due elementi qualunque / e 
g, si abbia / < g o g < /. La proposi¬ 
zione è valida perché 

[/<«V^/] = {xzX: f(x) < 

<*(*)} U {xzX: g(x)<f(x)} = X 
anche se non è vero che per tutti gli x 
si ha / (x) < g (x) o che per tutti gli x 
si ha g(x) < f (x). 


Un altro assioma cruciale è quello 
che afferma l’esistenza, per ogni / ^ 0, 
di un elemento g tale che / • g = 1. 
Deve perciò risultare valida la propo¬ 
sizione / ^ 0 -» a g (/ • g = 1). Ricor¬ 
dando che l’implicazione si può espri¬ 
mere per mezzo della negazione e 
della disgiunzione (<p -*■ 4* equivale a 
~ tp V (];), si vede che è sufficiente co¬ 
struire, per ogni f, una g tale che 
[/* 0] c [/ • g = 1] 

ovvero 

{x e X : f (x) ^ 0} c { x e X : f (x) ■ 

■ g (x) = 1}. 

Ebbene, basta definire g in questo 
modo: 

se / (x) ^ 0, g (x) = 

se / (x) = 0, g (x) = 0, o un al¬ 

tro valore qualsiasi. 

Da questa definizione può sembrare 
che il reciproco di / non sia determi¬ 
nato in modo unico, ma in senso pro¬ 
babilistico cosi non è. È facile control¬ 
lare con qualche calcolo che nella mi¬ 
sura in cui due funzioni sono il reci¬ 
proco di una stessa / esse sono anche 
uguali tra loro, ovvero che la probabi¬ 
lità che siano uguali è maggiore o 
uguale a quella che siano il reciproco 
della stessa funzione. In questo senso 
diventa anche valida l’affermazione 
che il reciproco di un elemento è unico. 

Questi due esempi dovrebbero basta¬ 
re a dare un’idea di come si debba ra¬ 
gionare nello spirito probabilistico, e 
quale significato si debba attribuire al¬ 
la validità di proposizioni complesse. 
Resta il fatto che, qualunque sia lo 
spazio di probabilità di partenza, gli as¬ 
siomi dei corpi ordinati, interpretati 
come abbiamo visto sul sistema delle 
variabili casuali, sono validi, e in que¬ 
sto modo viene a essere giustificata ri¬ 
gorosamente l’affermazione che le va¬ 
riabili casuali possono essere usate co¬ 
me. se fossero numeri reali. 

'Dicordiamo ora che noi cercavamo 
AV un modello dei numeri reali che 
mettesse in luce i limiti del teorema di 
unicità, ma la garanzia della unicità 
era data dall’assioma di continuità, di 
cui non abbiamo ancora detto nulla. 
Solo per formularlo, dobbiamo arric¬ 
chire e il linguaggio usato finora, e il 
sistema di oggetti che costituiscono il 
modello. Nell’assioma si parla di insie¬ 
mi di numeri, per cui dobbiamo con¬ 
siderare proposizioni della forma « / 
appartiene all’insieme S » (« / e S »); 
ma quale entità mettiamo al posto di 
S, a svolgere il ruolo di sottoinsieme di 
'K ? Si vede subito che non si possono 
prendere i veri sottoinsiemi di 11, per¬ 
ché altrimenti non si riesce a dare una 


valutazione a « / e S » secondo lo sche¬ 
ma probabilistico di ricondursi ai va¬ 
lori / (x) della funzione. I conti torna¬ 
no invece se S è proprio un sottoinsie¬ 
me di R; cosi mentre i nuovi numeri 
reali sono ben diversi da quelli classi¬ 
ci, gli insiemi di numeri reali sono pro¬ 
prio i sottoinsiemi di R. Potremo allo¬ 
ra definire 

[fzS] = {xzX: /(x)e 5) 
e ottenere una valutazione soddisfacen¬ 
te di tutte le proposizioni che parlano 
di insiemi di numeri reali. Si può ag¬ 
giungere che al modello non si posso¬ 
no associare tutti i sottoinsiemi di R, 
perché occorre naturalmente, come ri¬ 
sulta dalla definizione, che per ogni f 
{xzX : f (x) e S} 

sia un evento. Ci si può restringere al¬ 
lora ai cosiddetti insiemi di Borei, ma 
non è il caso di scendere nei partico¬ 
lari. L’importante è sapere che esisto¬ 
no insiemi con questa proprietà. 

J1 sistema delle variabili casuali <R 

con gli insiemi di Borei forma un 
corpo ordinato continuo in senso pro¬ 
babilistico. La dimostrazione che l’as¬ 
sioma di continuità è valido è natural¬ 
mente il punto cruciale di tutta la co¬ 
struzione, e premia la profonda intui¬ 
zione dell’ideatore del metodo, Dana 
Scott dell’Università di Oxford. Pur¬ 
troppo i dettagli della dimostrazione 
sono un po’ laboriosi e non possono 
essere dati; ricordiamo soltanto, per il 
lettore che volesse ricostruirsela, il pas¬ 
so essenziale: ammesso che un insieme 
S sia limitato superiormente, l’estremo 
superiore deve essere un elemento g 
tale che la proposizione « per ogni r, 
g ^ r se e solo se V / (/ e S -> / < r) » 
sia valida. Una variabile casuale g 
siffatta si può definire nel seguen¬ 
te modo: per ogni xzX, g (x) = 

= inf {<7 e Q : V/(/(x)£S->/(r) < q)}. 

Il modo in cui è definita la funzione 
g, tenendo conto della proposizione 
che si vuole risulti valida, è tipico del¬ 
le manipolazioni con i modelli proba¬ 
bilistici. 

Ricordiamo ancora che il .modello 
che abbiamo costruito può essere ulte¬ 
riormente arricchito con l’introduzio¬ 
ne di funzioni, funzionali e cosi via, in 
modo da risultare una struttura ade¬ 
guata alle necessità dell’analisi mate¬ 
matica, e addirittura un universo pro¬ 
babilistico della teoria degli insiemi. 

"V/ra vediamo infine di trarre alcune 
■ LTA conclusioni dall’esistenza di questi 
modelli non classici delle teorie mate¬ 
matiche. 

1) Una prima considerazione è di 
carattere logico, e si riallaccia al pro- 
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1. PROPRIETÀ ASSOCIATIVA 

VxVyVz{xU (y U z)) = ((xU y) U z) 
vx vy vz <xn (yn z» = ((x ny) nz> 


2. PROPRIETÀ COMMUTATIVA 

vxvy (xuy = yllx) ; VxVy(xny = yf|x) 


3. PROPRIETÀ DISTRIBUTIVA 

V x V y V z [x U (y n z) = (X U y) fi (X U z)] 

V x V y V z [x n (y U z) = (X n y) U (X n z)] 


4. PROPRIETÀ DI IDEMPOTENZA 

V x (x U x = x) ; V x (x fi x = x) 


5. PROPRIETÀ DI ASSORBIMENTO 

Vx Vy [xU(xfly) = x] ; V x V y [x f) (x U y) = x] 


6. ESISTENZA DEGLI ELEMENTI NEUTRI 

V x (x U o = x) ; V x (x fi 1 = x ) ; o I 


7. PROPRIETÀ DEL COMPLEMENTO 

V x (x U x' = 1) ; V x (x fi x' = 0) 


Un’algebra di Boole è un . sistema < B, U, (10,1 > che 
soddisfa gli assiomi elencati. I simboli sono quelli usati comu¬ 
nemente per indicare le operazioni insiemistiche, perché l’esem¬ 
pio tipico di algebra di Boole è costituito dalla famiglia dei 
sottoinsiemi di un insieme fissato X, con le solite operazioni 
insiemistiche. In tal caso 1 è l’insieme X stesso, e 0 l’insieme 
vuoto 0 . In un’algebra di Boole si può definire una relazione 
di « minore o uguale » nel seguente modo : x C y se e solo se 
x U y = y. Anche questa corrisponde, nell’esempio canonico, 
alla relazione di inclusione tra insiemi. Se S è un insieme di 


elementi dell’algebra di Boole, si indica con U S quell’elemen¬ 
to, se esiste, che è maggiore o uguale a tutti gli elementi di S 
e che è il piu piccolo che gode di questa proprietà. Un’algebra 
di Boole si dice completa se US esiste per ogni insieme S. 
La più semplice algebra è quella costituita da soli due elementi, 
0 e 1 ; le leggi delle operazioni booleane tra questi due ele¬ 
menti sono le stesse che regolano i valori di verità falso e vero 
delle proposizioni composte con la disgiunzione, la congiun¬ 
zione e la negazione. Il nome delle algebre deriva dal mate¬ 
matico e logico inglese George Boole (vissuto dal 1815 al 1864). 


blema da cui siamo partiti, dell’unici¬ 
tà del sistema dei numeri reali. È chia¬ 
ro che, scegliendo opportunamente lo 
spazio di probabilità, da quelli finiti a 
quelli infiniti di cardinalità arbitraria, 
si ottengono modelli profondamente 
diversi, e infatti si è potuto dimostrare 
che certe proposizioni, come l’ipotesi 
del continuo, sono valide nell’uno ma 
non nell’altro. Queste conclusioni pe¬ 
rò non dipendono dalla particolare tec¬ 
nica usata per costruire i modelli, e 
infatti quella originaria di Cohen era 
diversa. Ma 1’esistenza stessa di model¬ 
li non standard, di cui ne abbiamo esi¬ 
bito uno, ha questo significato: quan¬ 
do dimostriamo i teoremi di unicità 
prendiamo in considerazione solo al¬ 
cuni dei possibili modelli degli assiomi 
e ne scartiamo altri; quelli che esami¬ 
niamo risultano isomorfi (anche per il 
sistema dei numeri naturali si ripe¬ 


te tale situazione). Questa operazio¬ 
ne è fatta in modo che non è pos¬ 
sibile rilevare alcun imbroglio, in mo¬ 
do intuitivamente chiaro e corretto; 
ma per l’appunto solo intuitivamente, 
mentre non è possibile giustificarla lo¬ 
gicamente in modo rigoroso. Il difetto 
può essere sia nell’intuizione sia nella 
logica. 

2) Dal punto di vista matematico, la 
stretta connessione che abbiamo stabi¬ 
lito tra i numeri reali e le variabili ca¬ 
suali per mezzo dei modelli probabili¬ 
stici può rivelarsi feconda, permetten¬ 
do un interscambio di metodi e di ri¬ 
sultati. 

Se, per esempio, formuliamo la con¬ 
tinuità per mezzo delle successioni di 
Cauchy (come all’inizio della esposizio¬ 
ne), per dimostrare la validità del prin¬ 
cipio che le successioni di Cauchy so¬ 
no convergenti, si utilizza un teorema 


sulle funzioni (i nuovi numeri reali so¬ 
no funzioni!) che ci limitiamo a enun¬ 
ciare e che dice: se una successione di 
funzioni misurabili è fondamentale in 
misura, allora converge in misura a 
una funzione misurabile. 

Viceversa, una volta stabilito che 
tutti i teoremi sui numeri reali sono 
validi, si possono utilizzare dei teoremi 
sulla convergenza delle successioni di 
numeri reali per stabilire proprietà del¬ 
le variabili casuali del tipo di quelle 
delle leggi dei grandi numeri. 

Tutti i risultati che arricchiscono la 
nostra conoscenza delle variabili ca¬ 
suali sono importanti, in relazione al 
ruolo essenziale che queste ricoprono 
in molti campi della scienza; se que¬ 
ste tecniche daranno dei risultati, al di 
fuori della problematica logica da cui 
sono nate, è un problema che merita 
di essere approfondito. 
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Tre personaggi della matematica 

Perché i numeri e, i,x s f incontrano in matematica strettamente uniti? La 
« vera » spiegazione è semplice. Per e basta pensare alla capitalizzazione , 
per i alle rotazioni del piano; x scaturisce dal significato dei primi due 


di Bruno de Finetti 


P er poco che uno prosegua negli 
studi, incontrerà il numero (pi- 
-greco) n = 3,1415926... come 
rapporto della circonferenza al diame¬ 
tro, il numero e = 2,718281828... co¬ 
me base dei logaritmi naturali, il nu¬ 
mero ì = V - 1 come « unità immagi¬ 
naria » (ossia, a prima vista, come un 
trucco per inventare radici fittizie 
quando un’equazione ne manca). Se va 
avanti, si accorgerà però sempre piu 
che questi tre numeri si presentano 
ovunque come personaggi essenziali 
nel ragionamento matematico, e - ciò 
che forse è più sorprendente - si pre¬ 
sentano congiuntamente, strettamente 
collegati tra loro, mentre le consuete 
definizioni non ne lasciano neppure in¬ 
travedere il « perché ». 

Eppure la « vera » spiegazione è 
semplice e suscettibile di venir illustra¬ 
ta in modo elementare e intuitivo. L’iti¬ 
nerario predisposto per incontrare i no¬ 
stri tre personaggi (e, poi i, infine tt), 
lungi daH’apparire come un percorso di 
per sé privo di senso, di interesse e di 
giustificazioni, gioverà - spero - anche 
a formare un’efficace comprensione e 
una veduta panoramica, sostanzialmen¬ 
te organica benché non pedissequamen¬ 
te scolastica, su vaste ed essenziali aree 
del pensiero matematico. Non si richie¬ 
derà al lettore alcuna conoscenza pro¬ 
pedeutica specifica: tutte le nozioni 
che servono scaturiranno dallo stesso 
svolgimento della trattazione. 

Naturalmente, dato che la trattazione 
non può non essere alquanto succinta e 
dovrà introdurre concetti che si sup¬ 
pongono nuovi al lettore, occorrerà ri¬ 
chiedergli una certa attenzione e una 
disposizione d’animo non diffidente e 
ostile verso la matematica. Penso del 
resto che tale diffusissimo stato d’ani¬ 
mo sia dovuto non alla pretesa diffi¬ 
coltà o aridità della matematica, bensì 
ai metodi tradizionali del suo insegna¬ 


mento che insistono sul piatto formali¬ 
smo anziché scatenare la fantasia e la 
intelligenza creativa. Il difetto sta - per 
usare la felice immagine di Jerome S. 
Bruner - nel trascurare gli aspetti di 
pertinenza della « mano sinistra » (fan¬ 
tasia, intuizione, arte, gioco) disseccan¬ 
do tutto nella mera sistemazione razio¬ 
nale (di pertinenza della « mano de¬ 
stra »). Ed è notevole merito del Bru¬ 
ner (psicologo, non matematico) di aver 
ravvisato nella matematica, e nell’inse¬ 
gnamento e apprendimento della mate¬ 
matica, il campo ove l’intervento della 
« mano sinistra » sarebbe particolar¬ 
mente vivificatore ed è invece purtrop¬ 
po pressoché totalmente assente. 

La presente esposizione è stata scrit¬ 
ta (non so se e quanto riuscitamente) 
con la mano sinistra. 

Il significato di e 

Volendo scegliere la forma più im¬ 
mediatamente e concretamente intuiti¬ 
va, possiamo riferirci aH’esemplificazio- 
ne finanziaria e dire: nel tempo in cui 
un capitale, con l’interesse semplice, si 
raddoppia, se anche gli interessi frutta¬ 
no immediatamente interessi, risulterà 
moltiplicato per e (anziché per 2). Os¬ 
sia, un milione, anziché due milioni, di¬ 
viene 2 718 281. 

Beninteso, la stessa formulazione si 
può applicare per qualsiasi altro feno¬ 
meno. Per esempio, una popolazione di 
un milione di abitanti che aumentasse 
di 55 individui al giorno si raddoppie¬ 
rebbe in 50 anni; ma se rimane costan¬ 
te non il numero (55 individui) bensì 
l’intensità (55 per ogni milione al gior¬ 
no, ossia 0,055 %o al giorno), dopo 50 
anni la popolazione sarà non di due mi¬ 
lioni ma di 2 718 281. È chiaro (notia¬ 
mo incidentalmente) che una formula¬ 
zione così rigida snatura, per semplici¬ 
tà di espressione, il carattere meramen¬ 


te statistico, probabilistico, del fenome¬ 
no. È soltanto « molto probabile » che 
il risultato sarà « circa » quello indicato, 
(come per le frequenze di un gioco 
d’azzando); questo va sottinteso in ogni 
caso del genere. 

L’esempio che segue serve per accen¬ 
nare subito anche a una formulazione 
analoga che si ha quando si consideri 
il caso opposto, cioè una diminuzione. 
L’esempio più idoneo è quello di una 
sostanza radioattiva di cui in un anno 
si disintegri, per esempio, un atomo 
ogni mille. Avendo un miliardo di ato¬ 
mi, il primo anno se ne disintegrereb¬ 
bero un milione e, se tale numero ri¬ 
manesse costante, dopo mille anni gli 
atomi sopravvissuti si ridurrebbero a 
zero; ma se invece (come è chiaro) ri¬ 
mane costante l’intensità del fenomeno 



Il numero e può essere introdotto intuiti¬ 
vamente usando l’esemplificazione finanzia¬ 
ria. Nella capitalizzazione semplice (a) il 
montante cresce di quantità uguali in 


50 









(1 %o all’anno, cioè un atomo all’anno 
su ogni 1000 sopravvissuti) gli atomi 
superstiti dopo 1000 anni sarebbero 
circa 368 milioni (cioè ne rimarreb¬ 
bero nella proporzione 1/e = e -1 = 
= 0,367879...). Ciò risulterà evidente 
anche dal significato geometrico (si veda 
la figura in queste due pagine), ma è 
preferibile attendere di giungervi attra¬ 
verso l’itinerario che seguiremo. Si trat¬ 
terà - per anticiparne il senso in due 
parole - di vedere come dall’andamen¬ 
to rettilineo del caso dell’interesse sem¬ 
plice si passi alla curva esponenziale del 
caso dell’interesse continuo. È la curva 
che, a volte, è detta, soprattutto dai 
biologi, « curva dell’accrescimento na¬ 
turale » (attenzione però a non mitizza¬ 
re!). Vi giungeremo seguendo due di¬ 
versi approcci, o procedimenti. 

Un primo procedimento, consistente 
nell’applicare l’interesse semplice in in¬ 
tervalli sempre piu piccoli, conduce ad 
approssimare la curva esponenziale me¬ 
diante spezzate con ordinate in pro¬ 
gressione geometrica. Il secondo, consi¬ 
stente nell’aggiungere successivamente, 
al capitale, l’interesse (semplice), l’in¬ 
teresse dell’interesse, l’interesse dell’in¬ 
teresse dell’interesse, e via dicendo, 
conduce ad approssimare la stessa cur¬ 
va esponenziale mediante polinomi (e 
precisamente mediante lo sviluppo no¬ 
to col nome di serie di potenze). 

La capitalizzazione, semplice e continua 

Per sviluppare la trattazione ci rife¬ 
riremo sempre alla interpretazione fi¬ 
nanziaria che appare senz’altro la più 
direttamente espressiva (ma quanto vien 


detto vale per ogni altra esemplificazio¬ 
ne di «accrescimento naturale»). Co¬ 
minciamo con un cenno sulla capitaliz¬ 
zazione semplice: cosa significa? Come 
si rappresenta graficamente? Significa 
che un capitale produce un interesse, 
sempre lo stesso per intervalli di tempo 
uguali, e che (per usare la finzione abi¬ 
tuale ma efficace) l’interesse viene ac¬ 
cumulato in un conto a parte, che non 
produce interessi. Perciò il valore com¬ 
plessivo (capitale più interessi, che si 
dice montante) cresce di quantità ugua¬ 
li in tempi uguali, ossia, graficamente, 
cresce secondo una retta. Tale anda¬ 
mento è illustrato nella figura in queste 
due pagine con riferimento alla schema¬ 
tizzazione che ci sarà comoda : capitale 
« uno », andamento degli interessi e 
del montante nell’intervallo in cui il 
montante si raddoppia (che scegliamo 
convenzionalmente come unità di tem¬ 
po, indicandone con t = 0 e t = 1 gli 
istanti iniziale e finale). 

Osserviamo che, se l’interesse fosse 
negativo, la retta terminerebbe col va¬ 
lore zero al tempo 1; anche senza di¬ 
segnare la retta decrescente basta pen¬ 
sare di percorrerla in senso opposto 
(da destra a sinistra), o, se si preferi¬ 
sce, guardarla per trasparenza (da die¬ 
tro il foglio). 

Non c’è nessuna ragione, tuttavia, 
perché del denaro lasciato in deposito 
(si chiami pure « interesse » o come al¬ 
tro si voglia) non debba dar diritto a 
interessi. Perciò la capitalizzazione 
semplice non può venir considerata 
che una semplificazione di calcolo, co¬ 
moda si, ma tollerabile soltanto finché 
l’interesse relegato in un « conto infrut¬ 


tifero » rimane praticamente trascura¬ 
bile rispetto al « capitale ». Il modo lo¬ 
gico ed esatto di procedere consiste nel 
far affluire senz’altro l’interesse nel 
conto stesso del capitale rendendolo 
fruttifero istantaneamente. È questa la 
capitalizzazione continua che, come 
detto, conduce a definire il numero e. 

Ma converrà, come vedremo, consi¬ 
derare due diversi modi di avvicinarci 
a tale caso ideale mediante successive 
approssimazioni. Entrambi sono illumi¬ 
nanti per l’interpretazione concreta che 
forniscono e per la facilità con cui 
conducono - praticamente senza alcun 
calcolo e senza alcun prerequisito teo¬ 
rico - alle conclusioni che interessano 
e occorrono ai fini del nostro discorso. 
In sostanza, si tratterà anzitutto di di¬ 
mostrare che il montante finale salirà a 
e anziché a 2 seguendo, anziché la ret¬ 
ta, la curva esponenziale. 

Primo approccio 

Si può pensare che gli interessi ven¬ 
gano aggiunti al capitale, se non istan¬ 
taneamente, alla fine di periodi fissi più 
o meno brevi. Nella pratica ciò avviene 
in genere alla fine di ogni anno, o se¬ 
mestre, o trimestre, ecc. Nella nostra 
schematizzazione considereremo il pe¬ 
riodo totale « uno » diviso in due metà, 
quattro quarti, otto ottavi, e cosi di se¬ 
guito con successivi dimezzamenti. 

Dividiamo Pintervallo a metà. Alla 
fine della prima frazione (istante 
t = 1/2) il capitale 1 ha fruttato l’inte¬ 
resse 1/2 portando quindi il montante 
a 1 + 1/2 = 3/2 = 1,50; nella seconda 
frazione l’interesse, prodotto dal mon- 




tempi uguali, cioè secondo una retta. Nella capitalizzazione 
composta ( b ) gli interessi risultano produttivi durante le fra¬ 
zioni del periodo preso in considerazione e quindi la retta si tra¬ 
sforma in una spezzata con un numero di lati che aumenta all’au- 


mentare del numero di frazioni di periodo considerate; al limite 
si ha la curva esponenziale (in colore). La costruzione di ordi¬ 
nate equidistanti in progressione geometrica (c) mostra come, so¬ 
vrapponendo le strisce, le congiungenti concorrano in un punto. 
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tante 3/2 anziché dal capitale 1, non è 
più 1/2 bensì 3/4 (metà di 3/2 anziché 
metà di 1). Il montante finale è allora 
1 + 1/2 4-3/4 = 9/4 = 2,25; lo prova 
anche un ragionamento più diretto in 
quanto il montante si moltiplica per 
3/2 nella prima frazione e si rimolti¬ 
plica per 3/2 nella seconda e quindi in 
definitiva si moltiplica per (3/2) 2 = 9/4. 

È chiaro che, per lo stesso motivo, 
se dividiamo l’intervallo in n frazioni 
di durata 1 /n alla fine delle quali l’in¬ 
teresse ivi prodottosi diviene fruttifero, 
il montante finale sarà (1 + 1/n)". Do¬ 
po la prima frazione, infatti, il mon¬ 
tante sarà 1 + 1/n (1 = capitale, 1/n 
interesse di esso per il tempo 1/n), e lo 
stesso accrescimento si ripete n volte. 
È anche intuitivo che il montante fina¬ 
le risulterà tanto maggiore quanto mag¬ 
giore si prende n (ossia quanto più bre¬ 
vi sono le frazioni di periodo, 1/n, in 
cui l’interesse resta infruttifero), e che 
tale miglioramento diviene trascurabile 
quando n è grande perché allora si è 
già, praticamente, nella situazione di 
capitalizzazione continua. 

È ovvio pertanto che il valore di e 
si può approssimare (per difetto) calco¬ 
lando (1 + 1/n)” per n grande; d’al¬ 
tronde risulta (dal medesimo ragiona¬ 
mento) che è invece decrescente al 
crescere di n il valore (1 + l/n) n+1 
(cioè il montante che si otterrebbe at¬ 
tendendo una frazione di periodo in 
più: per esempio 5/4 anziché 4/4, 9/8 
anziché 8/8, 101/100 anziché 100/100. 
ecc.) e abbiamo cosi una doppia disu¬ 
guaglianza che consente di accertare il 
grado di approssimazione: 

(1 + 1/n)" < e < (1 + l/ro)" +1 . 
Queste disuguaglianze mostrano che, 
per n = 100, e vale circa 2,72 mentre 
per n = 100 000 ne rimane fissato il va¬ 
lore con quattro decimali esatti. Pos¬ 
siamo quindi scrivere e = (1 + 1/n)", 
cioè che e è « praticamente uguale a 
(1 + 1/n)" quando n è molto grande ». 
La dicitura non è rigorosa ma fornisce, 
penso, l’idea più chiara e sostanzialmen¬ 
te più esatta a chi non possiede con 
sicurezza i concetti e la terminologia 
dell’analisi matematica. 

La curva esponenziale e le sue proprietà 

Osserviamo ancora la figura in que¬ 
ste due pagine; si vede non solo co¬ 
me, infittendo le suddivisioni dell'inter¬ 
vallo, cresca il valore finale fino a toc¬ 
care il livello e, ma anche come le suc¬ 
cessive spezzate (di 2, 4, 8,... lati) ten¬ 
dano a confondersi con una curva. 

È la curva detta esponenziale, dia¬ 
gramma dei fenomeni che, come nella 
capitalizzazione continua e come negli 
altri esempi accennati (sviluppo di una 
popolazione, disintegrazione di una so¬ 


stanza radioattiva), avvengono con in¬ 
tensità costante di accrescimento (o di 
diminuzione). In altri termini : in tempi 
uguali si hanno accrescimenti (o decre¬ 
menti) percentualmente uguali, cosicché 
i valori assunti in una successione di 
istanti equidistanti (per esempio ogni 
anno, ogni ora, ogni secondo) variano 
in progressione geometrica, cioè cia¬ 
scuno si ottiene dal precedente molti¬ 
plicandolo per una costante a (positiva), 
maggiore o minore di 1 a seconda che 
la funzione è crescente o decrescente. 

Nel caso considerato (cioè se l’unità 
di tempo è quella in cui l’incremento 
di intensità costante la fa moltiplicare 
per e) il valore di a è appunto e. Ciò 
significa che la tangente alla curva, in 
corrispondenza alForigine, ha pendenza 
di 45° (come la bisettrice degli assi). 

L’equazione di una tale curva si scri¬ 
ve y = Ka‘, dove Al è il valore di y per 
t = 0 e a la detta costante (o base). In¬ 
fatti, per t = 1, 2, 3,... «,... i valori 
sono Ka, Ka 2 , Ka 1 ,... Ka n ,... (formanti, 
come detto, una progressione geometri¬ 
ca), e così vale per t = —1, -2, ecc. (ri¬ 
cordando che a~" significa l/a"); ciò va¬ 
le anche interpolando i valori t = -3/2, 
-1/2, 1/2, 3/2, 5/2, ecc., tenendo pre¬ 
sente che a I/2 significa Va, e in generale 
a h,k = k yf,aJi (e per continuità risulta il 
significato di a‘ per t qualunque). 

Le proprietà della curva esponenzia¬ 
le, in parte già viste basandosi sul si¬ 
gnificato delle potenze a h/k (peraltro 
spesso presentate e imparate come si 
trattasse di una convenzione), meritano 
però di venir approfondite direttamen¬ 
te, con considerazioni sia di natura geo¬ 
metrica che analitica. Esse mostreranno 
anzi che sarebbe probabilmente prefe¬ 
ribile definire a 1 partendo dalla funzione 
esponenziale e da ciò dedurre il signifi¬ 
cato di x c , in particolare per c = 1/2, 
c=\/n, c = m/n, c = — 1, c =—n, 
c = -m/n. 

Geometricamente, la proprietà carat¬ 
teristica di una successione di ordinate 
equidistanti y m in progressione geome¬ 
trica è che, prolungando i lati della 
spezzata, essi tagliano l’asse t a una 
stessa distanza dal piede della rispettiva 
ordinata (si veda la figura nelle due pa¬ 
gine precedenti). 

Per la curva esponenziale la stessa 
proprietà (caratteristica di tale curva) è, 
per chiara analogia, la costanza della 
sottotangente (cioè del segmento dell’as¬ 
se t intercettato dalla verticale e dalla 
tangente per un punto della curva). La 
sottotangente ha anche un significato 
fondamentale nell’interpretazione prati¬ 
ca : è il tempo in cui la funzione si 
raddoppierebbe (oppure si annullerebbe) 
se continuasse a crescere (o a diminui¬ 
re) conservando la stessa pendenza che 


ha nel punto considerato (ossia : prose¬ 
guendo secondo la tangente). Il recipro¬ 
co della sottotangente è pertanto la mi¬ 
sura della intensità di accrescimento (se 
a sinistra; se a destra di diminuzione). 

La sottotangente è uguale a 1 quan¬ 
do la base è e\ la definizione data di e , 
interpretata geometricamente, significa 
appunto tale fatto (ossia, come già det¬ 
to, che la tangente in t = 0 ha penden¬ 
za 45°; precisamente, è la retta che ta¬ 
glia l’asse t in t = -1 e l’asse y in 
y = 1). Al variare della base a, la cur¬ 
va non varia se non per un’alterazione 
proporzionale delle ascisse. 

La proprietà geometrica della succes¬ 
sione di ordinate equidistanti in pro¬ 
gressione geometrica, oltre che a pro¬ 
lungarla indefinitamente verso sinistra e 
verso destra, permette anche di comple¬ 
tare la curva inserendo punti intermedi 
a volontà; basta interpretare geometri¬ 
camente il significato di -\fa (ossia a I/2 , 
che è, nella usuale terminologia scola¬ 
stica, il « medio proporzionale » tra 1 
e a: infatti è x tale che 1 :x = x:a. 
x 2 = a); in forma solo apparentemente 
più generale, partendo da due successive 
ordinate y n e y n+l si costruisce in tal 
modo quella intermedia, y n+ 1/2 (e, ripe¬ 
tendo la costruzione, quelle a distanza 
ridotta a 1/4, 1/8, ecc.). 

Secondo approccio 

Abbiamo visto come il primo approc¬ 
cio ci abbia condotto a determinare, 
prima, il valore di e, e poi l’andamento 
della funzione e\ ossia del montante 
nella capitalizzazione continua. 

Indichiamo ora, rapidamente, alcune 
proprietà dell’esponenziale che è im¬ 
portante conoscere e che ci saranno 
utili nel seguito. 

Si ha e x+y = e x e y e, in generale, 
a x+y = a x a y . In altri termini, se qualcosa 
cresce moltiplicandosi per e x in un tem¬ 
po a e per e y in un tempo y, nel pe¬ 
riodo totale x + y si moltiplica per 
e x e y . [E inversamente: se una funzione 
/ è tale che f (x + y) = f (x) / ( y ) non 
può che essere un’esponenziale; / (x) = 
= a x \ quella considerata è una equazio¬ 
ne funzionale]. 

È vero per ogni t (come, per defini¬ 
zione, quando t = 1) che 

7 1 \ n,t ' 

[1 +t/n~) n = 14-s e 1 : 

LI n/t 1 

Nel secondo approccio usiamo anco¬ 
ra la stessa interpretazione finanziaria, 
sempre partendo dalla capitalizzazio¬ 
ne semplice, ma seguendo un concetto 
diverso per approssimarci via via alla 
capitalizzazione continua. Lasciamo gli 
interessi (semplici) in un conto a par¬ 
te; supponendolo fruttifero esso darà 


52 







Il numero e può essere introdotto anche con la capitalizzazio¬ 
ne continua. A sinistra abbiamo il diagramma di un capitale 
che varia in modo qualunque e l’interesse semplice da esso 
prodotto in un dato intervallo di tempo è dato dal rettangoli- 


no (in colore ) a esso corrispondente. La figura a destra mo¬ 
stra invece come si può giungere intuitivamente a spiegare i 
coefficienti dello sviluppo in serie di e' : il volume di una pi¬ 
ramide è 1/6 di quello del prisma di uguale base e altezza. 


gli « interessi degli interessi » che col¬ 
locheremo in un terzo conto; questo 
darà gli « interessi degli interessi degli 
interessi», e cosi proseguiremo. Avre¬ 
mo infinite aggiunte correttive sempre 
più trascurabili e riotterremo, al limi¬ 
te, la funzione esponenziale e'. 

Il capitale èie l’interesse semplice 
(al tempo t ) è t; fin qui nulla di nuovo. 
Ma calcoliamo ora l’interesse dell’inte¬ 
resse; come vedremo, esso è t 2 / 2, e la 
spiegazione di tale calcolo indica il ra¬ 
gionamento che si ripeterebbe per tutti 
i termini successivi. 

Pensiamo un momento al caso gene¬ 
rale di un capitale che varia in modo 
qualunque (per esempio a un conto cor¬ 
rente, con continui accrediti e addebi¬ 
ti), e consideriamone il diagramma (si 
veda la figura in questa pagina). L’in¬ 
teresse (semplice) da esso prodotto 
in un dato intervallo di tempo è dato 
dall’area corrispondente perché in ogni 
intervallino esso è dato dall’area del ret- 
tangolino (altezza = capitale, larghez¬ 
za = durata; il tasso, per la convenzio¬ 
ne iniziale, è 1). Nel caso del capitale 
costante 1, risulta che (come sapevamo 
da sempre) l’interesse è t: l’area del 
rettangolo di altezza 1 e base r; consi¬ 
derando l’interesse di tale interesse, tra 
0 et (ove esso è y = t), avremo che è 
l’area del triangolo rettangolo di base t 
e altezza t, cioè t 2 / 2, come asserito. 

Per mostrare che il termine seguente 
è t 3 /6, osserviamo che questo è il vo¬ 
lume di un tetraedro rettangolo, cioè 
(si veda la figura in questa pagina ) 
di un sesto del cubo di lato t. Pensando¬ 
lo tagliato a fettine perpendicolari all’as¬ 
se t, ciascuna di esse (per t = t) ha area 
t 2 /2 = «interesse dell’interesse al¬ 
l’istante t » e volume pari all’interesse 
prodotto da esso nel tempuscolo corri¬ 
spondente allo spessore della fettina. 
Perciò il volume complessivo di tutte 
le fettine, cioè del tetraedro, è l’inte¬ 
resse dell’interesse dell’interesse, come 
si voleva dimostrare. 

Il coefficiente 1/6 si può spiegare 


(sia pure a titolo di aiuto mnemonico 
apparentemente superficiale, ma il fon¬ 
damento è valido!) osservando che 
l’area del triangolo è base per metà del¬ 
l’altezza, il volume del tetraedro è base 
(area della) per un terzo dell’altezza, e 
un sesto è il prodotto di un mezzo per 
un terzo (ossia: 6 = 2 X 3 = 31). Pur 
mancando un’immagine nello spazio fi¬ 
sico, possiamo pensare di proseguire il 
ragionamento per figure analoghe in 4 
dimensioni, in 5, in generale in n : an- 
ch’esse si ottengono dividendo in n\ 
parti (24 per n = 4 dimensioni, 120 per 
5, ecc.) il cubo a n dimensioni, e il 
loro volume (/^dimensionale) è base 
[volume (n-l)-ddmensionale] per un //- 
-esimo dell’altezza, cosicché, proceden¬ 
do, si deve-fare il prodotto t (t/2) (t/3) 
(t/4)... (t/n) = t"/n\ 

Accettando - con o senza giustifica¬ 
zioni rigorose o intuitive (o pseudoin¬ 
tuitive) - che i termini sono del tipo 
t n /n\, abbiamo che: scomponendo il 
montante in capitale più interessi più 
interessi degli interessi ecc., avremo : 
e' = 1 + t + 

+ t 2 / 2! + f 3 /3! + ...+ t n /n\ + ... 

(In termini tecnici, questo è lo svilup¬ 
po della funzione esponenziale, e', in 
« serie di potenze »). 

Calcolo di e 

Per il calcolo di e tale sviluppo in 
serie riesce particolarmente idoneo. Po¬ 
nendo infatti t = 1 si ottiene la seguen¬ 
te espressione 

e=l + l + l/2+l/6+ 1/24 + 
+ 1/120 + 1/720 + 1/5040 + 

+ 1/40320 + ... 

ossia (coi soli termini scritti) e = 
= 2,718 278 766...; si può poi garantire 
quale grado di esattezza si sia raggiun¬ 
to osservando che la somma dei termini 
successivi trascurati è certamente infe¬ 
riore (ma circa uguale) a 1/8 dell’ul¬ 
timo termine considerato (che è 1/8!). 
ossia a 1/322560 = 0,000 003 100. In 


generale, arrestandosi al termine 1 /n\. 
l’errore è inferiore - ma praticamente 
quasi uguale - a 1/n di esso. 

È chiaro che altrettanto semplice è il 
calcolo di 1/e (e‘ per t = - 1): basta 
prendere la precedente serie con segni 
alternati. 

Ancor più rapidamente si giunge a 
un’eccellente approssimazione per t mi¬ 
nore di 1 (in valore assoluto). Per 
esempio per t = 1/2 si ha V ~e = e 1/2 = 
= 1 + 1/2 + l/(2 2 -2!) + l/(2 3 - 3!) + 
+ ... + 1/(2” • n!) + ... (e per ottenere 
1 / yf~è = e _I/2 basta alternare i segni). 


/ logaritmi naturali 

In chiusura di questo studio sul nu¬ 
mero e dobbiamo almeno dire cosa so¬ 
no i logaritmi naturali - dato che e in 
genere è noto proprio come la « base 
dei logaritmi naturali » - e perché Na- 
pier (1614) fu (sostanzialmente) condot¬ 
to a introdurli scegliendo la base e. 

La funzione logaritmo (in una base 
a qualunque, reale, positiva e diversa 
da 1, in genere maggiore di 1) è la fun¬ 
zione inversa della funzione esponen¬ 
ziale di base a. 

La nozione di funzione inversa è as¬ 
sai semplice e intuitiva, e non limitata 
al campo della matematica. Per esem¬ 
pio, « il numero di telefono di » e « il 
titolare del telefono numero » sono due 
funzioni inverse una dell’altra, le cui ta¬ 
belle sono gli elenchi alfabetici (ove si 
trova che « il numero di telefono di » 
Bruno de Finetti è 832360) e quelli nu¬ 
merici (ove si trova viceversa che « il 
titolare del telefono numero » 832360 è 
Bruno de Finetti). Nessuna differenza 
logica si ha nell’applicare tale concetto 
nella matematica : per esempio « il cu¬ 
bo di » e « la radice cubica di » (nel 
campo dei numeri reali) sono due fun¬ 
zioni inverse l’una dell’altra : se è y = 
=x i è x = 3 ^fy, e cosi in generale so¬ 
no inverse l’una dell’altra le funzioni / 
e g se y = / ( x) equivale a dire che x = 
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Diagramma di una funzione y = / (x) e della sua inversa x = g (y). Si passa da un 
diagramma all’altro scambiando gli assi, ossia eseguendo un ribaltamento rispetto al¬ 
la bisettrice y — x. Nel caso in cui la funzione diretta, anziché sempre crescere o de¬ 
crescere, riprendesse più volte gli stessi valori, la funzione inversa non esisterebbe. 


= g(y). Naturalmente occorre che la 
corrispondenza sia biunivoca (o, altri¬ 
menti, renderla tale con opportune li¬ 
mitazioni) : occorre per esempio che 
nessuno abbia piu di un telefono e nes¬ 
sun telefono più di un titolare, e non 
si potrebbe prendere l’esempio y — x 2 
e x = yfy perché x e —x hanno il me¬ 
desimo quadrato, e y ha o nessuna o 
due radici (salvo limitarsi al campo de¬ 
gli x e y positivi). 

Comunque, se si parla di funzioni 
sempre crescenti (o sempre decrescenti) 
cade ogni riserva del genere. Ed è fa¬ 
cile interpretare visivamente la nozione 
pensando al diagramma y = f (x); per 
ottenere quello di x = g (y) (funzione 
inversa) basta scambiare tra loro gli 
assi, ossia ribaltare il diagramma ri¬ 
spetto alla bisettrice (si veda la figura 
in alto), o, se si preferisce, guarda¬ 
re il diagramma da dietro il foglio e 
ruotato di un angolo retto (in modo da 
vedere l’asse y orizzontale con la frec¬ 
cia verso destra e l’asse x verticale con 
la freccia verso l’alto). 

Se si parte dalla funzione esponen¬ 
ziale y = a x , la funzione inversa, che 
dà x dato y, si dice per definizione lo¬ 
garitmo di y (in base a) : x = log a y o, 


(scambiando le lettere per indicare co¬ 
me d’uso con x la « variabile indipen¬ 
dente ») y = iog a x. 

Se a = 10 si ha il logaritmo deci¬ 
male (o di Briggs); se a = e, si scrive 
log x (sottintendendo la base) e il loga¬ 
ritmo si dice naturale (o di Napier) : e 
ciò proprio per lo stesso motivo che ci 
ha fatto riconoscere come privilegiata la 
base e per l’esponenziale, e cioè perché 
la tangente alla curva nel punto 1 del¬ 
l'asse y (ora asse x) ha pendenza 45° 
(si veda la figura della pagina a fronte). 

Anche il logaritmo si può esprimere 
mediante una serie di potenze. Si ha 
questo sviluppo, valido però solo per x 
compreso tra - 1 e + 1 : log (1 + x) = 
= x - x 2 /2 + * 3 /3 - x 4 /4 + x 5 /5 - 

- x 6 /6 + x 7 /7 - ...; osservando che 
log (1 - x) ha lo stesso sviluppo, ma con 
tutti i segni negativi, è chiaro che si ot¬ 
tiene un’espressione molto più sempli¬ 
ce facendo la differenza, log (1 + x) - 

- log (1 - x), che è il logaritmo del 
rapporto (1 + x)/(l - x), perché i ter¬ 
mini di grado pari si elidono mentre 
quelli di grado dispari si raddoppiano : 

log (1 + x)/(l -x) — 2 (x + x 3 /3 + 

+ x 5 /5 + x 7 /7 + x 9 /9 + 

+ x u /ll + ...). 


Questa formula permette il calcolo 
di log c per ogni c positivo e ci servirà 
in seguito per il calcolo di ir; in quel¬ 
l’occasione si vedrà anche per quale 
motivo essa non può essere valida che 
per x compreso tra - 1 e + 1. 

Riferiamoci nuovamente all’interpre¬ 
tazione finanziaria per illustrare prati¬ 
camente il significato del logaritmo e 
la ragione della proprietà caratteristica 
di cui gode (« il logaritmo del prodotto 
è la somma dei logaritmi »). Il logarit¬ 
mo di x è il tempo occorrente affinché 
un capitale cresca nel rapporto da 1 a 
x (se x è maggiore di 1; altrimenti è il 
tempo trascorso se da x è ora giunto a 
1). Ma il tempo occorrente affinché un 
capitale si accresca nel rapporto da 1 
a xy è la somma di quello occorrente 
perché cresca nel rapporto da 1 a x e 
di quello per cui poi cresca nel rappor¬ 
to da 1 a y; perciò log a xy = log„x + 
+ log a y (sostanzialmente la stessa cosa 
che a x+y = a x a y ). 

I logaritmi decimali sono, notoria¬ 
mente, i più convenienti per usi pratici 
y dato che 10 è la base del nostro sistema 
di numerazione. Il logaritmo decimale di 
10” è infatti n (per esempio log 10 10 = 
= 1, logj 0 100 = 2, log 10 1000 = 3,... 
logjo 1=0, log 10 0,1 =- 1, log,,, 0,01 = 
= - 2-,...). In generale, la parte intera 
(detta caratteristica) è il numero di po¬ 
sizioni di cui si deve spostare la virgola 
per portarla a destra della prima cifra 
significativa (positiva per spostamenti a 
sinistra, negativa per spostamenti a de¬ 
stra, cioè per numeri minori di 1); a 
essa va aggiunta, sempre positiva, la 
mantissa, cioè il logaritmo decimale del 
numero (tra 1 e 9,999...) che si ottiene 
spostando la virgola nel modo indicato. 

Va inoltre menzionato, almeno di 
sfuggita, anche il logaritmo in base 2. 
Nella « teoria dell’informazione » (se¬ 
condo Shannon) log 2 V è infatti il nu¬ 
mero di « bit » d’informazione occor¬ 
renti per individuare l’alternativa esat¬ 
ta tra N ugualmente probabili. Il bit 
(binary digit, cifra in codice binario) è 
l’informazione (SI-NO) del caso N = 2; 
è chiaro che se N = 2” bastano n ri¬ 
sposte SI-NO; nel caso di N qualun¬ 
que ciò sussiste in un senso meno ov¬ 
vio (di « media »). 

Il numero i 

Quale senso (intuitivo!) può avere 
Tintroduzione dell’unità immaginaria, i, 
e quindi dei numeri complessi? Poiché 
il numero i viene formalmente « defini¬ 
to » come « radice di meno uno » (i = 
= V~ — 1), è conveniente cominciare 
con il prospettare il significato di po¬ 
tenze e di radici, nel caso abituale dei 
numeri reali, in maniera da condurre 
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Il diagramma della funzione logaritmo (qui rappresentata sia in base e che in base 
IO) si ottiene ribaltando quello della funzione esponenziale (qui rappresentata da e' e 
da 10'). Si noti che, per il logaritmo, cambiando la base cambia solo la scala in senso 
verticale. Lo stesso accade anche per la scala orizzontale nel caso dell’esponenziale. 


a intravedere la desiderata estensione. 

È esattamente la stessa cosa, quando 
a contenuto, dire che 9 è il quadrato di 
3 perché 3X3 = 9, oppure perché la 
moltiplicazione per 3, ripetuta due vol¬ 
te, equivale alla moltiplicazione per 9 
[cioè, (3 X) (3 X) = (9 X)]: triplicare 
e poi di nuovo triplicare equivale a 
nonuplicare. Ma, mentre la prima dizio¬ 
ne richiama il significato specificamen¬ 
te aritmetico della moltiplicazione fra 
numeri, la seconda mette invece in evi¬ 
denza il significato puramente logico e 
generale della ripetizione di un’opera¬ 
zione o trasformazione. Ciò sembrerà 
ora. una sfumatura, ma è li, in germe, 
lo spunto decisivo. 

Ogni numero reale a (cosi come si è 
visto, nel precedente esempio, per a = 
= 3) verrà interpretato come la trasfor¬ 
mazione che a ogni cosa x, suscettibile 
di pensarsi moltiplicata per un numero, 
fa corrispondere il prodotto ax. 

Per fissare le idee su una rappresenta¬ 
zione più limitata e opportuna converrà 
riferirsi alla retta, e poi al piano, do¬ 
tati di un’origine fissa O. Se pensiamo 
di proiettare su uno schermo una retta, 
con O al centro, e di ingrandire o rim¬ 
picciolire l’immagine zoomando (si veda 
la figura nella pagina seguente), tutte 
le distanze da O (che rimane fisso) 
dei punti P, Q, R, S,... (che vengono 
portati in P’, Q’, R’, S’,...) risultano mol¬ 
tiplicate per uno stesso numero a 
(positivo e maggiore o minore di 
1 a seconda che si ha ingrandimento 
o impicciolimento); la moltiplicazione 
per - a (negativo) sarà poi la moltipli¬ 
cazione per a seguita da moltiplicazione 
per - 1 che è il ribaltamento della ret¬ 
ta intorno a O, ribaltamento che, vo¬ 
lendo, si può immaginare realizzato, 
senza uscire dalla retta, mediante una 
simmetria speculare, oppure, permetten¬ 
doci di invadere il piano, mediante una 
rotazione di 180° (sempre intorno a O). 

Lo stesso vale se si considerano non 
solo i punti di una retta ma tutti quelli 
del piano : la moltiplicazione per a posi¬ 
tivo fa scorrere tutti i punti lungo i rag¬ 
gi uscenti da O, allontanandoli o avvici¬ 
nandoli, mentre, se a è negativo, si ha 
inoltre una simmetria rispetto a O che 
scambia ogni raggio con quello oppo¬ 
sto, e che si può ancora sempre pensare 
ottenuta con una rotazione di 180° at¬ 
torno a O. Una tale trasformazione, che 
indicheremo essa pure con a (pratica- 
mente identificandola col numero a in¬ 
teso come moltiplicatore) si dice omo¬ 
tetia (diretta o inversa a seconda che a 
è positivo o negativo); la si può pensare 
limitata a una retta, o a un piano, o 
anche estesa a spazi a tre o più di¬ 
mensioni. 

La « identificazione » tra omotetie e 
numeri appare particolarmente giusti¬ 


ficata adottando il più espressivo lin¬ 
guaggio vettoriale : si può dire che l’o¬ 
motetia a non fa che moltiplicare per 
il numero a ogni vettore da O a P, nel 
senso che la lunghezza viene moltipli¬ 
cata per a, tenendo fissa la direzione, e 
conservando o invertendo il verso a se¬ 
conda che a è positivo o negativo. 

Il vet tore da O a P si indica spesso 
con OP, o, meglio, con P-O, notazio¬ 
ne che ha un significato operativo. Es¬ 
sa consente infatti di scrivere l’omote¬ 
tia (che porta P in P’) come prodotto 
dei vettori per a : ( P’-O ) = a X (P-O). 
Per « vettore » P-O si può per ora an¬ 
che intendere, brutalmente, la « frec¬ 
cia » da O a P; in effetti, però, è ines¬ 
senziale collocare tale disegnino dovun¬ 
que si vuole pur di conservare, nello 
spostamento, grandezza, direzione e ver¬ 
so. Meglio è dire la stessa cosa prescin¬ 
dendo da nozioni metriche (vedremo 
più avanti l’interesse di limitarsi alle 
nozioni affini; a tal fine basta.dire che 
è P-O = B-A se OPBA è un parallelo- 
grammo, ossia se i suoi lati opposti so¬ 
no paralleli, ovvero ancora, equivalen¬ 
temente, se le diagonali OB e AP si ta¬ 
gliano a metà (si veda la figura supe¬ 
riore a pagina 57). 

L’identificazione di omotetie e nu¬ 
meri va bene anche per il prodotto (è 


l’osservazione da cui siamo partiti) : è 
c — ab sia come prodotto (funzionale) 
di omotetie sia come prodotto (aritme¬ 
tico) di numeri. Il prodotto di due omo¬ 
tetie entrambe dirette o entrambe in¬ 
verse è pertanto ovviamente un’omote¬ 
tia diretta, mentre se una è diretta e 
l’altra inversa il prodotto è un’omote¬ 
tia inversa; il quadrato di un’omotetia 
è sempre un’omotetia diretta. 

Se chiamiamo radice (quadrata) di 
una trasformazione a una qualunque 
trasformazione b che ripetuta due vol¬ 
te equivale ad a, tale cioè che bb = a , 
possiamo dire perciò che nell'ambito 
delle omotetie se ne trovano sempre 
due (b e — b, con b = y/~a nel senso 
aritmetico) che sono radici della a se 
questa è diretta, mentre non se ne tro¬ 
va nessuna se questa è inversa. 

Tali considerazioni e conclusioni si 
potrebbero subito estendere in modo 
ovvio al caso di radici di ogni ordine 
(come in aritmetica, di radici «-esime di 
a ce n’è sempre una e una sola per n 
dispari, mentre, se « è pari, ce ne sono 
due, ± n y[~a, se a è positivo e nessuna 
se a è negativo). Ma arriveremo alle 
conclusioni generali che ci interessano 
proseguendo il ragionamento sulla sola 
radice quadrata. 

Rammentiamo solo che \Ta (per a 
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positivo) si può ottenere graficamente 
dalla costruzione nel semicerchio (x è 
medio proporzionale tra 1 e a) e che. 
ripetendola, si ottengono sulla curva 
esponenziale y = a‘ tanti punti quanto 
fitti si vogliano, cosicché rimane deter¬ 
minato con precisione grande a piacere 
il valore di ogni radice n ^J~a = a' per 
t = 1/n. 

Tentativo di evasione 

Dobbiamo quindi rinunciare alla ri¬ 
cerca di qualcosa che sia radice di 
« meno uno » ? Dobbiamo addirittura 
interdire tale ricerca come un’assurda 
insensata chimera? O rassegnarci a con¬ 
siderare valida una risposta consistente 
in mere e astratte convenzioni? 

Abbiamo già detto che il problema 
non ha soluzione se pensiamo di cer¬ 
carla nell’ambito delle omotetie (ossia 
dei numeri reali); ma, avendo visto che 
tale precisazione era stata messa in ri¬ 
lievo usando il corsivo, il lettore avrà 
forse capito che tutto stava nel cercare 
le radici altrove, in un campo oppor¬ 
tunamente allargato. 

Quale era l’ostacolo? Il ribaltamento 
della retta, pensato come simmetria, 
non può eseguirsi in due riprese. Ma, 
se si evade dalla retta pensando di po¬ 
terle far invadere il piano con una ro¬ 
tazione di 180°, allora la soluzione ap¬ 
pare ovvia : basta ripetere due volte 
una rotazione di 90° (anzi ce ne sono 
due, potendosi effettuare la rotazione 
in senso orario o antiorario). 

Dato che, anche se si volesse partire 
considerando solo la retta, tali opera¬ 
zioni obbligano a invadere il piano, di¬ 
viene ora obbligatorio considerare il 
piano (mentre prima era facoltativo). 
La due radici di - 1 che abbiamo sco¬ 
perte le chiameremo i (rotazione di un 
angolo retto in senso antiorario) e - i 
(rotazione di un angolo retto in senso 
orario); sono, nella locuzione dei primi 
vettorialisti italiani, gli « operatori ma¬ 


novella » che fanno ruotare il piano 
portando ogni vettore P-O in P’O = 
— i ( P-O ) o in - / (P-O) (si veda la fi¬ 
gura inferiore nella pagina a fronte). 

Il bello è che, appena si introduce i 
con questo significato, si ha automati¬ 
camente il modo di esprimere anche 
ogni altra rotazione, e anzi, più in ge¬ 
nerale ancora, ogni similitudine (cioè 
ogni rotazione combinata con un’omo¬ 
tetia, ossia ogni rotazione intorno a O 
combinata con ingrandimento o impic- 
ciolimento con centro in O). Ed è sem¬ 
plicissimo: basta considerare le com¬ 
binazioni lineari del tipo a + ib, cioè 
somma di un numero reale a e di un 
« numero immaginario » ib (prodotto 
dell’unità immaginaria i per un numero 
reale b); tali combinazioni si dicono 
numeri complessi, ma il loro significato 
(nell’interpretazione geometrica, che ne 
dà la visione più vera e profonda) è 
quello di similitudini piane. 

Prendiamo infatti un qualunque vet¬ 
tore P-O e applichiamogli l’operazione 
a + ib: cerchiamo cioè cosa risulti il 
vettore (P’-O) = (a + ib) (P-O). Voglia¬ 
mo naturalmente conservare la lineari¬ 
tà, e supponiamo quindi di poter svi¬ 
luppare il calcolo ottenendo (P’-O) = 
= a (P-O) + ib (P-O); risulta cioè che 
il vettore (P-O) è la somma di quello di 
partenza moltiplicato per a e di quello 
ruotato ad angolo retto moltiplicato per 
b (si veda la figura inferiore nella pagina 
a fronte). È chiaro che tale vetto¬ 
re risulta ruotato di un angolo d tale 
che tg & = b/a e alterato in scala nel 
rapporto da 1 a p = V a 2 + ^ 2 - 

Ciò vale per ogni P, e rimane cosi 
provato che l’applicazione di un nume¬ 
ro complesso a un vettore equivale al 
prodotto di un’omotetia p per una ro¬ 
tazione di angolo i>. Tale rotazione si 
può indicare con la notazione e' 9 , co¬ 
sicché a + ib = p e i9 (per ora si tratta 
di semplice convenzione, e non occorre 
specificare come si misurino gli angoli: 


quando la notazione assumerà un signi¬ 
ficato effettivo - come vedremo in se¬ 
guito - la misura sarà in radianti). 

Dato un numero complesso, a + ib = 
= p e‘ ù , a si dice sua parte reale, b coef¬ 
ficiente dell’immaginario, p modulo e 
l’angolo à argomento. 

Il piano complesso 

Conviene raffigurarsi i numeri com¬ 
plessi come punti di un piano, che si 
dice piano complesso, e altro non è che 
la naturale estensione al nuovo caso 
dell’asse delle ascisse sul quale abitual¬ 
mente si raffigurano i numeri reali. An¬ 
zi, tale asse rimane e si chiama asse 
reale; se ne aggiunge però un altro, or¬ 
togonale, passante per l’origine, come 
asse immaginario, e il punto P = (x, y), 
di ascissa x e ordinata y, si assume a 
rappresentare il numero complesso z = 
= x + iy; le sue coordinate cartesiane 
sono la parte reale e il coefficiente del- 
rimmaginario. Piu significativo è spesso 
considerarne le coordinate polari: il 
modulo, p, è la distanza da O, e l’ar¬ 
gomento, ù, è l’angolo che OP forma 
col semiasse reale positivo. 

A certi effetti è più efficace immagi¬ 
nare z = x + iy come il vettore P-O 
(la somma, infatti, si fa come per i 
vettori), o addirittura come la similitu¬ 
dine che porta il punto « 1 » nel pun¬ 
to P (ossia che porta il vettore unitario 
del semiasse reale positivo nel vettore 
P-O). In tal modo si vede subito come 
si costruisca geometricamente il prodot¬ 
to di due numeri complessi : costruendo 
triangoli simili (si veda la figura in alto 
a pagina 58). Infatti, eseguendo due 
similitudini, i moduli si moltiplicano 
(omotetie) e gli angoli (rotazioni) si 
sommano. 

La costruzione geometrica del pro¬ 
dotto viene messa efficacemente in luce 
considerando le successive potenze di 
un numero complesso: caso questo che 
ci interessa in modo particolare. 



Un omotetia, in questo caso un allungamento in proporzione 
1,5 circa, con centro O porta i punti P, Q, R, S rispettivamente 
nei punti P , Q’, R\ S\ Ciò vale sia per un’omotetia per la so¬ 
la retta (a sinistra), che per comodità di comprensione abbiamo 



spezzato in due, sia per il piano (a destra), sia infine per 
lo spazio. Nulla vieta infatti di pensare che i vettori della fi¬ 
gura a destra non stiano nel piano del disegno: possono es¬ 
sere infatti pensati « in prospettiva », cioè in tre dimensioni. 
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Sia z = x + iy = p e n ; le potenze 
z 2 , z 3 , z 4 ,... sono i vertici di una spezza¬ 
ta a forma di spirale formata da una 
successione di triangoli simili al primo, 
che ha per vertici i punti O, « 1 » e z 
(con angolo retto in « 1 »); i moduli va¬ 
riano in progressione geometrica (sono 
le potenze del modulo: p, p 2 , p 3 , p 4 ,...) 
mentre gli argomenti crescono sempre 
di è (sono i suoi multipli : à, 2 #, 3 il, 
4 Proseguendo nell’altro senso si 
hanno z~ l , z~ 2 , z“ 3 ,—; in particolare si 
noti, benché sia ovvio, che z _1 = 1/z ha 
modulo 1 /p e argomento - ù (rispettiva¬ 
mente il reciproco e l’opposto) (si veda 
la figura in basso nella pagina seguente). 
In particolare, se p = 1, tutte le poten¬ 
ze (positive e negative) hanno modulo 
1 (geometricamente: sono punti della 
circonferenza unitaria). 

Da questi sommari cenni su ciò che 
avviene nel campo dei numeri comples¬ 
si, e che l’interpretazione come punti 
o come vettori o soprattutto come simi¬ 
litudini del piano rende espressivi e in¬ 
tuitivi, si ricava subito che l’introdu¬ 
zione di i permette non solo di dare due 
radici quadrate a - 1, ma di dare a ogni 
numero - sia esso reale (positivo o ne¬ 
gativo) o complesso - n radici «-esime, 
qualunque sia n. 

Dato un qualunque numero z, di 
modulo p e argomento &, è chiaro in¬ 
fatti che ne sono radici «-esime tutti i 
numeri di modulo n y/~p e argomento 
è/n o altro differente da esso per 1 /«, 
2/n,... di angolo giro. Per esempio, le 
radici «-esime dell’unità sono i vertici 
del poligono regolare di « lati col cen¬ 
tro in O e uno dei vertici in « 1 » (e 
quelle di - 1 si deducono ruotando ta¬ 
le poligono di 1/2« di angolo giro). E 
analogamente nel caso generale : le « 
radici «-esime di z sono i vertici di un 
poligono regolare di « lati col centro in 
O e di cui una radice ha argomento 
è/n. 

Digressioni 

Il poco che si è detto potrebbe ba¬ 
stare per il nostro scopo immediato, che 
è duplice: 1) dare un’interpretazione 
e rappresentazione espressiva per i e 
quindi per i numeri complessi: e, con 
ciò, 2) fornire le premesse per giunge¬ 
re successivamente a introdurre l’ultimo 
dei nostri «personaggi», n. 

Riassumiamo le conclusioni : un nu¬ 
mero complesso z — x + iy si può pen 
sare rappresentato dal (o « identifica¬ 
to » col) punto P = (x, y) del piano 
complesso (di coordinate x e y), o equi¬ 
valentemente, e per certi aspetti meglio, 
dal vettore P-O (di componenti x e y), 
o infine (e nel modo piu espressivo) 


A B A B 




Dal punto di vista affine i due parallelogrammi mostrati in questa figura sono uguali; 
infatti, guardando uno qualsiasi di essi sotto un’opportuna inclinazione (da un punto 
infinitamente lontano) esso diviene uguale all’altro. Il punto di vista affine consiste 
appunto nel pensare «di non sapere quale sia la direzione giusta per guardare le figure». 



La rotazione ad angolo retto dei vettori di un piano (a) in senso antiorario, che indi¬ 
cheremo con i, porta P-0 in P’—O = i ( P—O ), ecc. Pensando fisso il punto O, porta P 
in P’ = O + i (P-O). La moltiplicazione per un numero complesso (6) fa ruotare 
tutti i vettori del piano (o tutto il piano se si tiene fisso il punto O) di un determi¬ 
nato angolo e inoltre altera in proporzione tutte le lunghezze dei vettori del piano. 


dalla similitudine che trasforma il vet¬ 
tore « 1 », o il punto « 1 » = (1,0), nel 
vettore (o punto) z = x + iy, il che si 
ottiene ruotando tutto il piano comples¬ 
so intorno a O fino a portare il semi¬ 
asse positivo a passare per il punto z, 
e operando poi una omotetia (diretta) 
per portare in definitiva il punto « 1 » 
nel punto z. 

Sembra tuttavia opportuno soffermar¬ 
si su alcune digressioni atte a chiarire 
dei possibili dubbi, o a sollevarli, per 
chiarire alcune sottostanti questioni an¬ 
che a coloro che potrebbero non es¬ 
sere sfiorati da alcun dubbio. Indiretta¬ 
mente, ciò potrà forse anche insegnare 
a crearsi dei dubbi, che è la via princi¬ 
pale per approfondire e far progredire 
le conoscenze. 

Piu o meno indirettamente, quasi 
tutte le considerazioni e digressioni di 
cui qui di seguito si darà cenno giove¬ 
ranno inoltre - pur senza essere indi¬ 
spensabili - a meglio penetrare il signi¬ 
ficato delle successive argomentazioni 
intese a farci incontrare rt. Giovano - 
beninteso - se uno le prende per quello 
che sono e che dicono, e cioè come 
semplici cenni informativi atti a dare 
un’idea intuitiva di come stanno le co¬ 
se; chi pretendesse ragionarvi sopra con 
sicurezza e cognizione di causa do¬ 
vrebbe approfondire l’argomento per 
non rischiare di confondersi anziché di 


procedere. Nelle digressioni che seguo¬ 
no, soprattutto di natura geometrica, 
cercheremo di dare almeno una vaga 
idea della reale utilità del ricorso a ciò ' 
che è stato chiamato « immaginario ». 

Il piano affine e la sfera complessa 

Un primo dubbio (o, in mancanza, 
un’impressione fallace) dovrebbe con¬ 
sistere in ciò: l’introduzione di i, nel 
modo che abbiamo seguito, presuppone 
la geometria metrica euclidea in quanto 
si basa sull’ortogonalità. L’obiezione, in 
questo momento, è fondata, perché, per 
illustrare la cosa nel modo più intuiti¬ 
vo, abbiamo scelto subito, senza discus¬ 
sione e quindi in modo acritico e mira¬ 
colistico, la risposta più comoda. Ma le 
riflessioni omesse prima, quando pote¬ 
vano disorientare, è bene farle ora per 
rimediare all’omissione. 

Di trasformazioni il cui quadrato è 
- 1 (nello stesso senso che per la ro¬ 
tazione ad angolo retto) se ne potevano 
trovare, nel piano, infinite. Fissata l’ori¬ 
gine O (anch’essa arbitraria) e due pun¬ 
ti P e P’ (qualsiasi, purché non allineati 
con O) si sarebbe potuta chiamare i la 
trasformazione lineare che porta P in 
P’, pur di stabilire che porti P’ nel sim¬ 
metrico di P. Occorre e basta, cioè 
porre : 

i (P-O) = (P’-O) e i ( P’-O) = -(P-O), 
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Z = Zi Z2 



Il prodotto di due numeri complessi z i e 
z 2 è la similitudine che si ottiene effettuan¬ 
do quella che porta 1 in Zi e poi quella 
che porta 1 in z 2 . Essa porta quindi 1 in 
z =: Zi Zi. La figura mostra la costruzio¬ 
ne geometrica, mentre le linee sottili 
mostrano che sono simili anche i triangoli 
Olz, e Oz 2 z. (Ovviamente è anche z = z 2 Zi). 


con che (per la linearità) i resta definita 
su tutto il piano. 

Nel senso cosi ampliato avremmo 
trasformazioni lineari « radici di meno 
uno » ; è un caso che si può studiare, 
ma la struttura piu interessante (per 
motivi sia teorici che applicativi) si ha 
quando vi si include un’unica trasfor¬ 
mazione i (o, più precisamente, una 
coppia ± i). 

Tale scelta equivale all’introduzione 
di una metrica nel piano (se prima ne 
era sprovvisto, cioè era affine). Per spie¬ 
garci alla buona: possiamo sempre in¬ 
trodurre in un piano coordinate carte¬ 
siane tali che O sia l’origine e P e P' 
i punti « uno » sugli assi x e y; dire 
che il piano è affine significa dire che 
siamo ancora liberi di scegliere (se vo¬ 


gliamo introdurvi una «metrica») un 
sistema di coordinate cartesiane qua¬ 
lunque - per esempio scegliendo ad ar¬ 
bitrio i punti O, P, P’ di cui sopra - 
cui conferire la qualifica di « ortogona¬ 
le monometrico ». In altri termini, nel 
piano affine possiamo solo distinguere 
(come guardandolo obliquamente) se 
due rette sono o no parallele, e se due 
segmenti paralleli sono o no uguali (si 
veda la figura in alto nella pagina prece¬ 
dente); confronti tra angoli e fra lun¬ 
ghezze di segmenti non paralleli non 
hanno senso. 

Per darvi senso si può e basta sce¬ 
gliere ad arbitrio due coppie di rette 
(separantisi) e dirle ortogonali, oppure 
un triangolo ABC e dirlo equilatero, 
oppure dirlo isoscele rettangolo in A, 
e ciò è appunto quel che si è detto so¬ 
pra per OPP’. Ma ciò è anche la stessa 
cosa della scelta di i (salvo che essa in¬ 
clude anche la scelta di un verso di ro¬ 
tazione positivo, che cambia cambian¬ 
do i in - i mentre ciò non altera la 
metrica). 

Il piano si può proiettare sulla sfera (o 
viceversa) mediante la proiezione stereo- 
grafica (si veda la figura nella pagina a 
fronte) che gode della proprietà di es¬ 
sere conforme (cioè di conservare gli 
angoli). Essa è usata anche in cartogra¬ 
fia, dove tale proprietà significa che la 
zona intorno a qualunque località sarà, 
si, ingrandita in misura diversa rispetto 
alla sfera-mappamondo da cui si può 
immaginare proiettata (e precisamente 
tanto più quanto maggiore è la distanza 
dal centro O) ma senza distorsioni (ven¬ 
gono conservati gli angoli e i rapporti 
fra lunghezze in qualunque direzione). 

z 4 


Il piano complesso si può proiettare 
sulla sfera - e ottenere la sfera com¬ 
plessa, altra forma di rappresentazione 
dei numeri complessi - in modo da ave¬ 
re (in linguaggio geografico per riferirsi 
al caso familiare del mappamondo) il 
punto O (zero) al polo nord, i punti 1, 
i, -1, -i a 90° l’uno dall’altro sul¬ 
l’equatore che corrisponde al cerchio 
unitario (p = 1) come tutti gli altri pa¬ 
ralleli ai cerchi p = costante, mentre i 
meridiani corrispondono ai raggi = 
= costante (con = 0, naturalmente, 
per il meridiano ove si è collocato il 
punto 1, semiasse reale positivo) 

Al polo sud non corrisponde alcun 
punto del piano, ma si avvicina a esso 
l’immagine di un punto che, sul piano, 
si allontana indefinitamente da O in 
qualunque direzione: si dice perciò che 
il polo sud rappresenta il numero « in¬ 
finito». Tale convenzione è comoda — 
per dire meglio, appropriata - nel caso 
dei numeri complessi perché, sia dal 
punto di vista algebrico sia da quello 
analitico, attraverso trasformazioni (per 
esempio passando da z a 1/z) il punto 
all’infinito si trasforma in un altro qua¬ 
lunque senza manifestare eccezionalità. 

Per tutte le funzioni « abbastanza na¬ 
turali » (il senso di tale locuzione si 
potrà intravedere fra poco) si presen¬ 
ta « naturale » l’estensione al campo 
complesso, come vedremo per la fun¬ 
zione esponenziale, la cui definizione, 
già data per e* (con x reale) verrà este¬ 
sa a e z (con z = x + iy complesso) : in 
questo caso, come in altri, è possibile 
procedere all’estensione, giungendo 
sempre al medesimo risultato, basando¬ 
si vuoi sulla conservazione di proprietà 
formali (equazioni funzionali), come 
e x+y = e x e y , o dello sviluppo in serie 
(e x = 1 + x + a^/ 2! + x 3 /3! + ...), o di 
« proprietà locali » (equazioni differen¬ 
ziali) come De x = e x , ossia, « e 1 è la 
funzione che è anche la derivata di se 
stessa », ecc. 

Quest’ultima enunciazione richiede 
di venire spiegata per dare un’idea in¬ 
tuitiva di ciò che è la derivata nel cam¬ 
po reale e nel campo complesso, e di 
cosa significa la sua esistenza. 

Una retta passante per il punto (x a , 
y a ) ha l’equazione y = y a + c (x-x Q ), 
dove il coefficiente c indica la « pen¬ 
denza » della retta. Se consideriamo 
una funzione /, la tangente al suo dia¬ 
gramma in un suo punto (x Q , y a ), ove 
naturalmente y 0 = f (x c ), è una retta del 
tipo predetto, e dove c dev’esser preso 
in modo che la retta abbia ivi « la 
stessa pendenza » dèlia curva. (Pren¬ 
dendo c troppo grande la retta è più 
pendente, cioè sta al di sotto del dia¬ 
gramma nel tratto immediatamente a 
sinistra, e sopra a destra; viceversa se 



La costruzione geometrica del prodotto viene messa efficacemente in luce consideran¬ 
do le successive potenze di un numero complesso con esponenti interi, positivi o ne¬ 
gativi. Si ottiene una spirale (il cui andamento potrebbe essere prolungato indefini¬ 
tamente in entrambi i sensi) costituita da, una successione di triangoli simili al primo. 
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CENTRO DI PROIEZIONE 


Quando da un punto di una sfera (polo) si proiettano gli altri punti della sfera su 
un piano tangente alla sfera stessa nel polo opposto (proiezione stereografica), i pa¬ 
ralleli — in particolare l’equatore — diventano cerchi e i meridiani rette (coordinate 
polari). Questa rappresentazione è conforme (conserva gli angoli fra rette qualsiasi). 
Per certe questioni conviene pensare, anziché al piano complesso, alla sfera com¬ 
plessa: per esempio, per non dare una particolare posizione «eccezionale» all’infinito. 


c si prende troppo piccolo. Se la curva 
ammette tangente c’è un unico c né 
troppo grande né troppo piccolo). Tale 
c si dice « derivata » di / in x Q \ comun¬ 
que basti fissare in mente che in pros¬ 
simità di x = x Q (finché la curva si con¬ 
fonde, praticamente, con la tangente) 
vale approssimativamente f(x) = f(x 0 ) + 
+ c (x-x 0 ). 

Analogamente, w = w Q + c (z - z Q ) 
(con c, z e w complessi) è la funzione 
lineare che in z„ assume il valore w a e 
il cui valore in z si ottiene aggiungendo 
lo spostamento z-z 0 moltiplicato per c 
(ossia, se c ha modulo p e argomento 8, 
moltiplicato per p e ruotato dell’angolo 
è). Se, per mostrare graficamente l’an¬ 
damento di w = u + iv in funzione di 
z = x + iy, tracciamo le linee di livello 
(per quote equidistanti) di u e di v, è 
chiaro che abbiamo sempre una rete a 
maglie quadrate (come per rey) salvo 
la rotazione e il cambiamento di scala 
(da 1 a 1/p). E cosi per una funzione 
w = /(z), se avviene che in prossimità 
di z— z 0 sia approssimativamente /(z) = 
= / (z Q ) + c (z-z 0 ) con un opportuno 
c (che si dice derivata della / in z 0 ), co¬ 
sicché la rete delle linee di livello u = 
= costante e v = costante ha ivi ma¬ 
glie (in piccolo) quadrate, allora la rap¬ 
presentazione è conforme e concorde 
(conserva gli angoli e l’orientazione). Le 
funzioni che si considerano nel campo 
complesso sono quelle che godono di 
tale proprietà ovunque salvo eccezioni 
(per esempio, ovviamente, dove la deri¬ 
vata è nulla come per w = z 2 in z = 0). 

Per mostrare quanto la condizione 
sia restrittiva basti dire due fatti. Affin¬ 
ché w = /(z) = u (z) + iv (z) la sod¬ 
disfi, a una data u (z) si può associare 
solo una corrispondente v (z), e vicever¬ 
sa (a meno di una costante); per esem¬ 
pio w = ax + iby la soddisfa solo se 
a = b, ossia quando è w = az. E affin¬ 
ché /(z) sia univocamente determinata 
basta conoscerla su un’infinità di punti. 
In particolare, è unica la funzione /(z) 
coincidente con la / (x) supposta nota 
per x reale (e questa stessa funzione 
dev’essere « abbastanza naturale » dal 
momento che, una volta data in un 
tratto breve quanto si voglia, non può 
venir prolungata se non esattamente in 
un solo modo). 

Anche le linee di livello del modulo 
e dell’argomento di w si tagliano orto¬ 
gonalmente e danno maglie quadrate 
se in luogo del modulo si considera il 
suo logaritmo, perché ciò corrisponde a 
considerare le linee corrispondenti a 
u = costante e a v = costante per la 
funzione w = log / (z). Particolarmente 
efficace risulta la visualizzazione delle 
funzioni di variabile complessa facendo 
apparire in rilièvo il plastico del modu¬ 


10 (o suo logaritmo), su cui le linee di 
livello dell’argomento appaiono come 
le linee di massima pendenza (si veda 
la figura a pagina 62). 

11 numero tz 

Dopo aver imparato a conoscere i 
primi due dei nostri personaggi, e e /, 
saranno essi stessi a presentarci sponta¬ 
neamente il terzo, cioè pi-greco (n). Ab¬ 
biamo già visto un’espressione, sia pu¬ 
re introdotta a titolo convenzionale, in 
cui figuravano uniti : con e' 9 avevamo 
indicato infatti il numero complesso 
che rappresenta la rotazione di un an¬ 
golo 8. Basterà mostrare che essa ha 
effettivamente il significato di funzione 
esponenziale per numeri immaginari, 
pur di misurare gli angoli nel modo 
appropriato: è cioè in radianti ossia 
con la lunghezza del corrispondente 
arco su un cerchio di raggio «uno». 

E tz altro non è che tale lunghezza 
per l’angolo piatto (180°), ossia è la 
lunghezza della semicirconferenza che 
va dal punto z = + 1 al punto opposto 
z = — 1. Pertanto è = - 1; è que¬ 
sta la celebre relazione che lega tra lo¬ 
ro i nostri tre personaggi, e che appar¬ 
ve tanto mirabile e misteriosa ai ma¬ 
tematici che per primi ebbero la ven¬ 
tura d’imbattersi in essa e di riflettervi 
sopra (cominciando da Eulero). 

L’interpretazione pili intuitiva si ha 
pensando al moto del vettore c‘®, o del 
punto P = O + e' 9 , in funzione di 8 
inteso come tempo. Il punto P percorre 
il cerchio unitario, con velocità unita¬ 
ria in senso antiorario, partendo dal 
punto « uno » in 8 = 0. A ciò condu¬ 
cono concordemente (come vedremo) 


tutte le vie atte a estendere al caso di 
esponente immaginario le considerazio¬ 
ni svolte nel caso reale, e cioè ponendo 
e i9 = (1 + iH/n) n (per n grande) 
oppure 

e' 9 = 1 + ;8 + (z’8) 2 /2! + 

+ {i8) 3 /3! + 0’8) 4 /4! + ... 

(cioè e i9 = 1 + r8 per 8 piccolo) 
o anche 

e' 9 = e 1 ’®' e'®" (se 8 = 8’ + 8”). 

Le prime due espressioni ci consenti¬ 
ranno di sviluppare in seguito conside¬ 
razioni analoghe a quelle viste nel ca¬ 
so reale, secondo i due « approcci » ivi 
seguiti, dimostrando e illustrando quan¬ 
to asserito. Ma l’ultima formula ci dà 
subito, sostanzialmente, la dimostrazio¬ 
ne che ci interessa, espressa peraltro 
solo in forma intuitiva. 

Tra gli istanti 8 e 8 + A (con A pic¬ 
colo) il punto P si sposta da O + e’ 9 a 
O + e i(s+A) , ma poiché e i<9+A) = 
= e i3 e iA = e' 9 (1 + z'A) = e' 9 + A • ie li> , 
l’ultimo addendo esprime lo spostamen¬ 
to come prodotto del tempuscolo A per 
la velocità ze i9 , che è pertanto ortogo¬ 
nale e « uguale » (nell’unità di tempo 
implicitamente adottata) al vettore P-O. 
Il moto avviene pertanto tagliando 
sempre ortogonalmente i raggi uscenti 
da O, e quindi circolarmente intorno a 
O; e precisamente sul cerchio unitario 
perché in 8 = 0 passa per il punto 
z = 1, e con velocità unitaria perché 
uguale al raggio (si veda la figura nella 
pagina seguente). 

Il legame tra e, i e tz che dovevamo 
determinare è con ciò stabilito, ma, per 
l’effettiva determinazione e calcolo, 
dobbiamo invertire la formula. Formal- 
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mente potremmo tentare di scrivere 
ift = loge ! ' 8 , 
da cui, essendo 

e** = - 1, e™/ 2 = i, e 1 *' 4 = 1 + i/yf2. 
si ha 

ir. = log (- 1), ir. = 2 log;', 
ir = 4 log [(1 + 0//2], 

In precedenza, parlando dell’espo¬ 
nenziale e accennando ai logaritmi, ave¬ 
vamo visto gli sviluppi in serie per il 
logaritmo validi però solo per x reale 
e compreso tra - 1 e + 1. Potranno 
servirci nel presente caso? Fortunata¬ 
mente si, mediante il semplice accorgi¬ 
mento di ragionare, anziché su it, su t = 
= tgil; più direttamente ancora, si trat¬ 
ta di considerare i punti 1 + it e 1 - it, 
intersezioni con la verticale passante 
per il punto « uno » delle rette che 
fanno un angolo ® col semiasse reale 
positivo (rispettivamente sopra o sotto). 
Il rapporto (1 + it)/(l - it) è il fattore 
che moltiplicato per (1 - it) dà (1 + it), 
ossia è la rotazione di un angolo 2it che 
porta (1 - it) in (1 + it). 

Abbiamo e 28 ' = (1 + it)/{ 1 - it), 
quindi liti = log [{1 + it)/{ 1 - if)], 
e, applicando lo sviluppo in serie visto 
a suo tempo, 

liti = 2 [(;?) + (it) 3 /3 + 

+ (it) 5 /5 + (it) 1 /! + ...] = 

= 2 (it - it 3 /3 + it 5 /5 — it 1 /I + ...), 
e infine 

it = arctg t = 

= t-t 3 /3 + t s /5 - f/1 + ... 

(dove con arctg t si indica l’angolo la 
cui tangente è t). 

Come sappiamo, tale sviluppo è va¬ 
lido per t compreso tra - 1 e + 1, os¬ 
sia per angoli fino a 45°; delle formule 
sopra scritte solo l’ultima (per t = 1, 
ossia per i) = n/4) vi rientra (e proprio 
all’estremo). Comunque essa dà n/4 me¬ 
diante la celebre « serie di Leibniz » : 
n/4 = 1 - 1/3 + 1/5 - 1/7 + 1/9 - ... 

ASSE IMMAGINARIO 


A 



Pensando ù come tempo », e' 8 rappreseli- 
la un punto che si muove lungo il cer¬ 
chio di raggio unitario con velocità uni¬ 
taria, facendo cioè un giro nel tempo 2n. 


Si possono anche ottenere altre for¬ 
mule che danno una convergenza piu 
rapida (una migliore approssimazione 
con un minor numero di termini); con 
tali formule si è giunti a calcolare, con 
elaboratori elettronici, oltre 100 000 ci¬ 
fre decimali di rt. 

L’esponenziale e il logaritmo nel campo 
complesso 

Le precedenti considerazioni condu¬ 
cono senz’altro a estendere l’esponen¬ 
ziale al campo complesso ponendo, per 
z = x + iy, e z = e x+iy = e x e iy . Cosi (e 
solo cosi) rimane infatti valida anche 
nel campo complesso la proprietà ca¬ 
ratteristica dell’esponenziale, e z ' + z " = 
= e z ' e z ". Al medesimo prolungamento 
conducono del resto anche le altre 
espressioni, come si vedrà piu avanti; 
intanto diamo uno sguardo al signifi¬ 
cato della trasformazione w = f (z) e 
constateremo che è conforme (come oc¬ 
correva). E ciò, in base al criterio di 
unicità asserito in generale (in fine delle 
discussioni sulle funzioni f (z) con z 
complessa), conferma che è l’unica fun¬ 
zione complessa che coincide con e x 
sull’asse reale. 

Conviene, per maggior chiarezza, con¬ 
siderare due piani distinti (si veda la figu¬ 
ra in alto nella pagina a fronte): il piano 
z su cui rappresentiamo i punti z = x + 
+ iy, e il piano w sui cui rappresen¬ 
tiamo i corrispondenti punti w = / (z) = 
= e z — e x e iy . Osserviamo subito che al 
punto z di coordinate cartesiane x e y 
sul primo piano corrisponde sul secondo 
il punto w di cui il modulo e x e l’argo¬ 
mento y sono le coordinate polari. 

Il modo più immediato per render 
« visibile » la corrispondenza consiste 
nel disegnare dei sistemi di linee che 
si corrispondono; ciò è del resto fami¬ 
liare anche daH’abitudine a vedere la 
rete dei meridiani e paralleli sulle carte 
geografiche. Nel nostro caso si presenta 
naturale la scelta di una quadrettatura 
a coordinate cartesiane sul piano z (pen¬ 
sando segnate le rette equidistanti x = 
= ka e y = ka, con k intero e a scelto 
opportunamente ai fini del disegno), al¬ 
la quale viene a corrispondere, sul pia¬ 
no w, una rete a tela di ragno, formata 
da raggi equidistanti uscenti da O 
(anomalia & = ka) e da cerchi di cen¬ 
tro O e con raggi crescenti in progres¬ 
sione geometrica (modulo p = e ka ) di 
ragione e a . 

Conviene scegliere a in modo che 
l’angolo it = a fra due raggi sia « co¬ 
modo », cioè opportuno sottomultiplo 
dell’angolo retto, per esempio a — 1° = 
= ■k/ 180° = 0,017453 oppure a = 10° = 
= 0,17453. 


Si vede subito che anche la « tela di 
ragno » è a « maglie quadrate » come 
la quadrettatura vera e propria (natu¬ 
ralmente, solo nel senso che ciò è tan¬ 
to più approssimativamente vero quan¬ 
to più piccole sono le suddivisioni, os¬ 
sia a; se a è grande evidentemente due 
lati sono sensibilmente curvi, e uno 
maggiore dell’altro, mentre gli altri due 
sono rettilinei ma convergenti; ma per 
a tendente a zero tutte queste imperfe¬ 
zioni vanno scomparendo). 

C’è un fatto importante, finora non 
menzionato per non complicare il di¬ 
scorso, che sarà più chiaro ora che com¬ 
pleteremo la discussione parlando del 
logaritmo: nel campo complesso, 
l’esponenziale è una funzione periodi¬ 
ca. È infatti e 2l,i = 1 e quindi e z+ni — 
= e z ; la funzione riprende lo stesso va¬ 
lore spostandosi di multipli di Ir in di¬ 
rezione dell’asse immaginario, ossia è 
periodica di periodo 2ri. 

Da ciò che abbiamo visto circa la 
corrispondenza tra il piano z in coordi¬ 
nate cartesiane e il piano w in coordi¬ 
nate polari si può dedurre senza alcun 
calcolo che il logaritmo di un numero 
complesso, di cui si conosca il modu¬ 
lo p e l’argomento 9, è log (pe i8 ) = 
= log p + id + 2kri dove l’aggiunta di 
un multiplo qualsiasi di Irti è ovviamen¬ 
te necessaria per l’ovvio fatto che l’an¬ 
golo & si può alterare di quanti si vo¬ 
gliano angoli-giro in un verso o nel¬ 
l’altro senza che muti la posizione del 
punto pe' 8 . È un fatto ovvio, ma aveva¬ 
mo evitato di rilevarlo; ora è più chiaro 
il suo significato sia riguardo all’espo¬ 
nenziale sia riguardo al logaritmo. 

Il piano z si può pensare tagliato in 
infinite strisce orizzontali mediante le 
parallele y = (2 k + 1) it all’asse rea¬ 
le y = 0 (con k intero, positivo o ne¬ 
gativo); ognuna di queste strisce corri¬ 
sponde a tutto il piano w e, nello stesso 
modo, a un punto w corrispondono infi¬ 
niti punti z (uno per ogni striscia, so¬ 
vrapponibili sovrapponendo le strisce). 
Per capire come ogni striscia si trasfor¬ 
mi per coprire tutto il piano, si imma¬ 
gini dapprima che la metà sinistra (x 
negative) si rattrappisca raccorciandosi 
e restringendosi a punta e che da tale 
punta si apra poi come un ventaglio 
dilatandosi fino a coprire il giro di 360°; 
il tratto di asse immaginario (x = 0, 
0 < y < 2iz) si trasforma nel cerchio 
unitario; l’asse reale si trasforma nel se¬ 
miasse reale positivo il semiasse posi¬ 
tivo nel tratto 1 < w < + quello 
negativo nel segmento 0 < w < 1, ove 
0 corrisponde a x = — °°). 

Ai « tagli » che dividono le strisce 
del piano z corrisponde un taglio sul 
piano w lungo il semiasse reale nega¬ 
tivo; oltrepassandolo si passa da una 
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Corrispondenza fra il piano della variabile z = x + iy, con 
rete delle coordinate cartesiane (a) e quello della variabile w 
data dalla funzione iv = e z ( b ). La rete corrispondente è in 
coordinate polari. Al punto z = 0 corrisponde w — 1 ; a x > 0, 
U)> 1 e a r < 0, ai < 1 (parte fuori o dentro del cerchio w = 1 
corrispondente all’asse immaginario x = 0 per z); iv = 0 


corrisponde a x = - oo. Nelle due figure a destra, il piano z 
si vede diviso in strisce di ampiezza 2it i (c) e il piano ui 
moltiplicato in infiniti fogli sovrapposti e collegati a elicoide 
(d) per mostrare come, al variare di y (di & per io), ui ripren¬ 
de gli stessi valori per ogni accrescimento di 2it su y (di 2lt i 
per z). L’elicoide dà un’immagine più espressiva della situazione. 


striscia del piano z a quella successiva 
(nel medesimo verso). Abbandonando 
l’immagine dei tagli (utile per una pri¬ 
ma spiegazione, ma evidentemente arti¬ 
ficiosa e arbitraria) si può viceversa 
pensare il piano w formato di infiniti 
fogli sovrapposti formanti come una 
rampa elicoidale (si veda la figura in 
allo). Secondo l’immagine precedente, 
ogni striscia del piano z corrisponde a 
un piano-foglio della rampa w tagliata 
lungo il semiasse positivo; col vantag¬ 
gio però che, pensando distinti ideal¬ 
mente i punti sovrapposti sulla rampa 
e corrispondenti al medesimo valore w, 
si ha una corrispondenza biunivoca tra 
il piano z e la rampa w. 

Le serie di potenze 

Queste considerazioni ci permettono 
di chiarire cosa avviene dello sviluppo 
in serie, che (secondo quanto sappiamo 
per il campo reale) dovrebbe dare 
log (1 + z) = z - z 2 /2 + 

+ z 3 /3 - z 4 /4 + ... 

Ma per quali z varrà lo sviluppo? 
Abbiamo detto, nel campo reale, che 
esso vale per z compreso tra - 1 e + 1 
ed è facile vedere che la convergenza 
dipende solo dal modulo di z e quindi 


varrà nel cerchio di raggio R = 1 in¬ 
torno al punto-origine dello sviluppo. 
In generale, sia a n z n il termine generi¬ 
co della serie, e vediamo se, per un 
dato z, la successione tenda o no a ze¬ 
ro; se si presentano entrambi i casi, è 
ovvio che la tendenza a zero avverrà 
per tutti gli z di modulo sufficientemen¬ 
te piccolo (fino a un certo R) e non 
avverrà per quelli maggiori (oltre tale 
R) (e sarà iì=Oofi = “sela con¬ 
vergenza non si ha mai oppure sempre). 
È chiaro che, fuori del cerchio di rag¬ 
gio R, lo sviluppo non può esser valido; 
senza che i termini tendano a zero è 
intuitivo che non può aver senso la 
«somma della serie». Il fatto che i 
termini tendano a zero non basta però 
a garantire che tale « somma » abbia 
senso, ma, nel nostro caso, risulta che 
il dubbio può sussistere solo sul cer¬ 
chio di raggio R, mentre all'interno 
tutto va bene (perché i termini diminui¬ 
scono almeno altrettanto rapidamente 
che una progressione geometrica). Si 
potrebbe subito dedurre l’espressione di 
R in base al teorema di Cauchy-Hada- 
mard; in pratica esso dice che R è il 
confine tra gli * per cui nella successio¬ 
ne a n x n vi sono o no infiniti termini 
maggiori di 1 (in valore assoluto). 


Ma c’è un fatto assai più significa¬ 
tivo (anche se è meno facile intuirne 
la dimostrazione) : R è la distanza dal 
piu vicino punto « singolare », dove 
cioè (in qualche senso) la funzione è 
irregolare. Il caso più semplice è quel¬ 
lo di un punto ove la funzione assume 
il valore « °° » (per esempio per w = 
= 1/z in z = 0). Altro caso è quello 
di un «punto di diramazione», come 
per esempio l’origine z = 0 per la fun¬ 
zione w = Vz. girando attorno al qua¬ 
le la funzione cambia di segno (trala¬ 
sciamo di menzionare altri tipi di pun¬ 
ti singolari). Nel caso del logaritmo, 
z = 0 è un punto di diramazione infi¬ 
nita perché vi si uniscono gli infiniti 
fogli della rampa e, girandovi intorno, 
si passa da uno all’altro (e infatti il cer¬ 
chio di raggio R = 1 con centro nel 
punto « 1 » passa per l’origine). Come 
immagine: il campo di convergenza si 
espande in tutte le direzioni, circolar¬ 
mente, finché il cerchio urta contro un 
punto singolare e deve fermarsi. 

Per fissare l’attenzione sul solo aspet¬ 
to che forse può risultare istruttivo sen¬ 
za approfondire tutta la teoria, possia¬ 
mo dire e suggerire di tener presente 
che tutto dipende dall’esistenza e di¬ 
sposizione dei punti singolari (di cui ne 






Se, partendo dal punto 1, ci si sposta di 1 in senso ortogonale 
si arriva in 1 + i (primo disegno). Se ci si sposta di 1/2, e 
poi si ripete la stessa similitudine, si arriva in (1 + i/2) 1 (se¬ 


condo disegno). Lo stesso accade per 4 e 8 passi, cominciando 
con 1 + i/4 e I + i/8, ecc. Si ha in questo modo una serie 
di spezzate che si approssimano sempre più all’arco di cerchio. 
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Rappresentazione grafica del modulo della funzione / (z) = tg z in prospettiva assono¬ 
metrica. Questo metodo di rappresentazione dà direttamente informazioni sui moduli p 
che danno le «curve di livello» del plastico e sugli argomenti d che danno invece le 
«curve di massima pendenza». Questo metodo è interessante in quanto accentra la sua 
attenzione sul modulo della funzione anziché sulle sue parti reale e immaginaria. 


esiste sempre almeno uno, escluso il 
caso banale della « funzione » w = co¬ 
stante; però, se l’unica singolarità è in 
z = ai nostri effetti non conta). 

Prendendo come punto di partenza 
un qualunque punto Zo (non singolare) si 
può esprimere w = / ( z ) = / [ Zo + ( z - 
- Zo )] in serie di potenze di ( Z - Zo ), 
valida entro il cerchio di raggio pari al¬ 
la distanza da z a del piu vicino punto 
singolare. Per un Zl fuori di tale cerchio 
il procedimento, direttamente, non va¬ 
le; però ci permette di ricavare l’ana¬ 
loga serie in ( z - Z] ) prendendo come 
punto di partenza un qualunque punto 
Z) interno al cerchio, e tale sviluppo 
sarà valido nel cerchio che si estende 
a toccare il piu vicino punto singolare, 
cerchio che andrà al di fuori del pre¬ 
cedente. E cosi di seguito si può, sal¬ 
tando da z 0 a Zi e poi a Z j, ecc. copri¬ 
re con successivi cerchi un’area sem¬ 
pre piu vasta e raggiungere qualunque 
punto del campo di esistenza. 

L’interpretazione in base 
ai due « approcci » iniziali 

L’interpretazione dell’esponenziale 
nel campo reale, nel « primo approc¬ 
cio », consisteva nel considerare e x , li¬ 


mite di (1 + x/n)", come capitalizzazio¬ 
ne continua intesa nel senso di capita¬ 
lizzazione semplice in periodi molto 
piccoli alla fine dei quali gli interessi 
venivano aggiunti al capitale. Geome¬ 
tricamente, il grafico y = e x era ap¬ 
prossimativamente dato dalla successio¬ 
ne di ordinate in progressione geome¬ 
trica y h = (1 + 1 /n) h in corrispondenza 
alle ascisse x h — h/n (con n grande). 

Nel campo complesso tale interpre¬ 
tazione geometrica è ancor più eviden¬ 
te: i punti Zh = (1 + i/n) h , potenze di 
Zi = 1 + i/n , sono i vertici di una 
spezzata a spirale ottenuta giustappo¬ 
nendo triangoli rettangoli simili a quel¬ 
lo iniziale coi vertici nei punti 0, 1 e 1 
+ i/n (si veda la figura in basso nella pa¬ 
gina precedente). Pensando, in una vi¬ 
sione dinamica, a un moto che fa sal¬ 
tare al punto z h nell’istante = h/n, 
il « tempo » & non corrisponderebbe pe¬ 
rò aH’angolo & (argomento) del punto Z; , 
se non approssimativamente (o, più pro¬ 
priamente, asintoticamente) per n gran¬ 
de (ogni salto fa girare di un angolo di 
cui 1 /nè la tangente, non l’arco, e cioè 
un po’ meno). 

Per mostrare, come dovevamo, la 
concordanza fra l’estensione basata su 
questo approccio e quella della via ini¬ 


zialmente seguita, resta a provare che, 
per n grande, la spezzata a spirale di¬ 
venta praticamente circolare; in termi¬ 
ni di moto, il moto è praticamente 
quello circolare uniforme con velocità 
unitaria (sia pure effettuato attraverso 
n scattti aventi lunghezza 1/n per uni¬ 
tà di tempo). 

In sostanza basta mostrare che e‘, de¬ 
finito come limite di (1 + i/n)", è 
proprio, come concluso per altra via, il 
punto del cerchio unitario di anoma¬ 
lia 1 (angolo: un radiante); va poi da 
sé che tutta la spezzata coincide prati¬ 
camente con quella che si ha di¬ 
videndo l’arco in n parti uguali e retti¬ 
ficandole (sostituendole con la loro 
corda). 

Vediamo dunque quali siano il mo¬ 
dulo e l’argomento dei vertici delle no¬ 
stre spezzate, i punti (1 + i/rì) h . Il mo¬ 
dulo di 1 + i/n è la radice di 1 4- 1/n 2 , 
quello della sua potenza ù-esima è 
quindi (1 + \/n 2 ) h/1 , e per h = n è 
(1 + l/ri 2 )" 12 = e l/2n = 1; per n grande 
il punto finale va a cadere sul cerchio 
unitario. I lati della spezzata crescono 
secondo la stessa progressione geometri¬ 
ca dei moduli (ragione 1 + 1/n 2 ) comin¬ 
ciando con 1/n; ma, poiché per n 
grande i moduli iniziale e finale coin¬ 
cidono (= 1), la lunghezza finale è sem¬ 
plicemente 1/n moltiplicato per n, os¬ 
sia 1. Tutto è provato. 

Parlando del « primo approccio » ci 
siamo limitati all’interpretazione geo¬ 
metrica, ma si sarebbe potuto anche 
dire che il moto circolare mostra l’an¬ 
damento del montante nella capitaliz¬ 
zazione continua con ... interesse imma¬ 
ginario unitario (l’interesse di un capi¬ 
tale reale positivo è immaginario po¬ 
sitivo, di un capitale reale negativo è 
immaginario negativo, di un capitale 
immaginario positivo è reale negativo, 
di un capitale immaginario negativo è 
reale negativo). Naturalmente, ciò non 
ha alcun senso neH’interpretazione fi¬ 
nanziaria, ma spesso anche un’immagi¬ 
ne traslata riesce utile sia per porre at¬ 
tenzione ad analogie formali utili, sia 
perché in tal modo si può esser con¬ 
dotti ad avvedersi dell’esistenza di altri 
casi nei quali l’interpretazione ha ve¬ 
ramente senso. 

Si può osservare, incidentalmente, 
che si sarebbe potuto parlare di « in¬ 
teresse negativo » per descrivere lo 
sconto (capitalizzazione con tempo in¬ 
vertito), dove lo sconto dello sconto sa¬ 
rebbe stato positivo, t 2 / 2; e in genere 
t"/n\ andava preso con segno positivo 
o negativo a seconda che n fosse pari 
o dispari (il che dà appunto lo svilup¬ 
po di e-‘). 

Ma intanto ricorriamo comunque a 
tale immagine, di un interesse immagi¬ 
nario (senza preoccuparci della sua in- 
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y A PRODUZIONE 



Rappresentazione schematica semplice di perturbazioni che generano oscillazioni. Sup¬ 
posto che esista equilibrio quando il livello dei prezzi è x a e il livello della pro¬ 
duzione è y„, un prezzo inferiore o superiore a detto livello spinge a diminuire o ad 
accrescere la produzione mentre una produzione inferiore o superiore al rispettivo li¬ 
vello di equilibrio provoca una diminuzione o un aumento dei prezzi. Ogni sposta¬ 
mento dal punto di equilibrio provoca un movimento ciclico che, nelH figura, è 
stazionario; potrebbe però anche essere smorzato o, al contrario, «esplosivo», cioè 
rappresentato da spirali che si avvicinano a Po o che si allargano sempre di piu. 


sensatezza finanziaria) per farne uso 
nel « secondo approccio ». 

Nello sviluppo in serie di e ix tutti i 
termini sono i medesimi che per e x , 
cioè x n /n\, tranne che sono moltiplica¬ 
ti per i n , ossia moltiplicati a rotazione 
per 1, i, - 1, - i. È proprio quel che 
accadrebbe applicando un interesse 
immaginario : se si parte da un capita¬ 
le reale positivo, gli interessi sono im¬ 
maginari positivi, gli interessi degli in¬ 
teressi sono reali negativi, e via di se¬ 
guito. Il montante avrebbe una compo¬ 
nente reale, continuamente oscillante 
fra ± 1 (supponendo un capitale ini¬ 
ziale unitario), in quadratura di fase 
con l’altra (cioè: l’una tocca i valori 
estremi quando l’altra si annulla). 

Ma questo è il comportamento tipico 
dei fenomeni oscillatori: nel pendolo, 
(per esempio) lo spostamento e la velo¬ 
cità variano in questo modo, e inter- 
pretaz'c-ni analoghe si hanno in molti 
altri campi della fisica; in particolare in 
elettrotecnica. Indicando, per il pendo¬ 
lo, con x lo spostamento e con y la 
velocità, avviene che, rappresentando 
nel piano il punto ( x, y), ossia il punto 
z = x + iy, esso si muove di moto cir¬ 
colare uniforme (beninteso, prendendo 
opportune unità di misura per sposta¬ 
mento e velocità). Per un cenno si pre¬ 
sta meglio un esempio diverso, cioè un 
modello schematico di fluttuazioni eco¬ 
nomiche. Supponiamo di indicare con 
x lo scostamento dei prezzi e con y lo 
scostamento delle quantità (produzione') 
dai rispettivi livelli medi (di « equili¬ 
brio »), scegliendo le unità di modo che 
x e y oscillino tra + 1 e - 1. Qui si 
ha la stessa rotazione e, con opportuna 
unità di tempo, sarà z = e"; i prezzi 
alti (x > 0) inducono ad accrescere la 
produzione (y salirà da - 1 a + 1), 
mentre una quantità elevata (y > 0) 
farà abbassare i prezzi (x scenderà da 
+ 1 a - 1), e cosi si girerà sempre lun¬ 
go il cerchio (in senso antiorario) 
(si veda la figura in questa pagina). 
Beninteso, perché sia proprio un cerchio 
occorrono ipotesi particolari (ma sem¬ 
plici e « naturali ») di proporzionalità; 
inoltre, altre ipotesi possono far preve¬ 
dere che le oscillazioni si smorzino o 
divengano « esplosive » (si riducano o 
crescano di ampiezza), ma ciò va oltre 
gli scopi del presente cenno. 

Riflessioni finali 

Nella scorribanda appena terminata 
abbiamo incontrato, come ci eravamo 
ripromessi, i tre famosi personaggi ma, 
oltre che farne la conoscenza, ne ab¬ 
biamo approfittato per esplorare un po’ 
le regioni ove essi sono nati, per ren¬ 
derci conto del perché sono nati, per 
intravedere molte cose più o meno col¬ 


legate e che meritano di attirare l’at¬ 
tenzione. 

E il lettore? Avrà forse un po’ di ca¬ 
pogiro? Ha la sensazione di aver visto 
fugacemente troppe cose, e troppo in 
disordine? Può darsi, dato che certa¬ 
mente è abituato al metodo scolastico 
di fare un passo per volta, di essere 
obbligato a collocare un mattone so¬ 
pra l’altro, come un manovale che non 
sa cosa stia costruendo (un castello o 
una prigione, un bunker o uno stadio, 
un’officina o un manicomio). 

Ma, al confronto, quel metodo era 
preferibile? Poiché l’unico risultato, 
purtroppo incontestabile, di quel tipo di 
insegnamento è la pressoché unanime 
avversione e incomprensione nei riguar¬ 
di della matematica, sembrerebbe dif¬ 
ficile sostenerlo. E, verosimilmente, co¬ 
loro che lo ritenessero preferibile in 
quanto « più facile » intenderanno as¬ 
serire (con ragione, senza dubbio) che 
costa minor fatica ottenere la promo¬ 
zione e superare un esame ripetendo 
enunciati e procedimenti stereotipati 
senza apprezzarne scopo ed essenza per 
poi dimenticarli al più presto, che non 
limitandosi magari a meno ma con 
l’obbligo di capirlo. Ed è altrettanto ve¬ 
ro che sarebbe più facile superare l’esa¬ 
me in una lingua se bastasse saper leg¬ 
gere con discreta pronuncia qualunque 
testo senza sapere il significato di nes¬ 
suna parola né addirittura distinguere 
parole effettive da altre inventate o con¬ 
traffatte. Ma, in entrambi i casi, si deve 
obiettare che - da questo punto di vi¬ 
sta — meglio ancora è non studiare nul¬ 


la perché quel poco o tanto di fatica, 
anziché utile, è controproducente, dise¬ 
ducativo, deleterio. 

Come mia esperienza personale (di 
ragazzo), ricordo che, pur riuscendo fa¬ 
cilmente nella matematica scolastica, 
preferivo le materie umanistiche che, 
nonostante la degradazione a materia 
scolastica, conservavano qualcosa di 
vivo. Ma ebbi la fortuna di appassio¬ 
narmi alla matematica grazie a opere 
divulgative o culturali, come le polemi¬ 
che a quell’epoca incandescenti prò o 
contro la relatività, o come l’antologia 
di saggi da vari autori (da Platone a 
Einstein) di Andreas Speiser che, tra 
l’altro, col mirabile eclettismo dell’au¬ 
tore, includeva come esempio di strut¬ 
tura matematicamente concepita il Pa¬ 
radiso, nella descrizione di Dante e nel¬ 
la raffigurazione del Tintoretto. 

Ora si insiste molto su argomenti e 
metodi qualificati (con dubbio gusto) 
« matematica moderna ». Sono cose ot¬ 
time se usate con criterio per giungere 
prima e meglio a quella che è pur sem¬ 
pre « la matematica che serve » ; se in¬ 
vece vengono considerate come fine a 
se stesse gonfiate a scapito del resto, 
non farebbero che peggiorare gli aspetti 
negativi della matematica « scolastica ». 
Ciò che occorre è suscitare interesse e 
curiosità con visioni ampie e suggesti¬ 
ve, insegnare, più per problemi che per 
teorie, usare ogni metodo utile ad am¬ 
pliare le prospettive (e anche, certo, 
i metodi propri della « matematica 
moderna», ma in quanto utili, non 
in quanto sedicentemente « moderni »). 
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Algebra di Boote, diagrammi di Venn 
e calcolo proposizionale 

di Martin Gardner 



Diagramma di Venn per l’intersezione 
di insiemi. 



Premessa: «Tutti gli uomini sono mortali». 


UOMINI MORTALI 



Premessa: «Socrate è un uomo». 


Ad Aristotele va tutto il merito di aver fondato la logica formale nonostante 
abbia quasi interamente limitato la sua attenzione al sillogismo. Ora che 
JL JLil sillogismo è diventato una parte banale della logica, è difficile credere 
che per 2000 anni esso sia stato l’argomento principale degli studi logici e che 
ancora nel 1797 Kant potesse scrivere che la logica era « un corpo di conoscenze 
chiuso e completo ». 

« Nelle inferenze sillogistiche — ha spiegato B. Russell — si suppone di sa¬ 
pere già che tutti gli uomini sono mortali e che Socrate è un uomo: da ciò 
si deduce quello che non si era mai sospettato prima, che Socrate è mortale. 
Questa forma di inferenza viene effettivamente usata, anche se molto raramen¬ 
te ». Russell prosegue dicendo che il solo esempio di cui aveva avuto notizia gli 
veniva da un numero umoristico di « Mind », una rivista inglese di filosofia, che 
l’editore aveva preparato nel 1901 come numero speciale di Natale. Un filosofo 
tedesco, reso perplesso dalle inserzioni pubblicitarie della rivista, fece proba¬ 
bilmente questo ragionamento: in questa rivista tutto è scherzo, le inserzioni 
pubblicitarie sono in questa rivista, quindi le inserzioni sono scherzi. « Per chi 
vuol diventare un logico — scrisse Russell in altra occasione — posso suggerire 
un consiglio sul quale non insisterò mai abbastanza: non impari la logica tradi¬ 
zionale. Ai tempi di Aristotele ciò rappresentava uno sforzo degno di rispetto, 
ma lo stesso può dirsi dell’astronomia tolemaica.» 

L’anno della grande svolta fu il 1847, quando George Boole (1815-1864), 
un modesto autodidatta figlio di un povero calzolaio inglese, pubblicò L’analisi 
matematica della logica. Questa e altre pubblicazioni lo portarono (benché non 
avesse titoli universitari) all’incarico di professore di matematica al Queens 
College (l’attuale University College) di Cork, in Irlanda, ove scrisse il trattato 
Una ricerca sulle leggi del pensiero sulle quali sono fondate le teorie matemati¬ 
che della logica e delle probabilità (Londra, 1854). L’idea fondamentale — la 
sostituzione con simboli di tutte le parole usate nella logica — non era nuova, 
ma fu Boole il primo a presentare un sistema funzionale dal punto di vista 
operativo. Nel complesso, i filosofi e i matematici del suo tempo non mostrarono 
molto interesse per questo notevole risultato. Forse fu questa una delle ragioni 
dell’atteggiamento tollerante di Boole verso gli eccentrici della matematica. Scris¬ 
se un articolo su un tipo bisbetico di Cork, certo John Walsh (« Philosophical 
Magazine », novembre 1851) che Augustus De Morgan nella sua Raccolta di 
paradossi, definisce « la miglior biografia che io conosca di un eroe del genere ». 

I pochi che apprezzarono il genio di Boole (in particolare il matematico 
tedesco Ernst Schroder) migliorarono rapidamente la notazione booleana che 
presentava alcune deficienze soprattutto perché Boole aveva tentato di rendere 
il suo sistema quanto più poteva aderente all’algebra tradizionale. Per « algebra 
di Boole » si intende oggi una struttura astratta « non interpretata », che può 
essere assiomatizzata in molti modi, ma che essenzialmente è una versione mi¬ 
gliorata e semplificata del sistema di Boole. « Non interpretata » vuol dire che 
ai simboli che descrivono la struttura non viene assegnato alcun significato di 
natura logica, matematica o fisica. 

Come per tutte le algebre puramente astratte, si possono dare molte inter¬ 
pretazioni diverse ai simboli booleani. Lo stesso Boole interpretò il suo sistema 
in modo aristotelico, come un’algebra delle classi e delle loro proprietà, che 
era però un’ampia estensione dell’antica logica delle classi oltre gli stretti con¬ 
fini del sillogismo. Poiché la notazione di Boole è stata superata, l’algebra di 
Boole moderna è scritta usando i simboli della teoria degli insiemi, intendendo 
per insieme la stessa cosa che Boole intendeva per classe: una qualunque col¬ 
lezione di singoli « elementi ». Un insieme può essere finito, come quello costi¬ 
tuito dai numeri 1, 2, 3 (che indicheremo con (1, 2, 3|) o dagli abitanti di 
Milano che hanno gli occhi verdi, o dagli spigoli di un cubo, o dai pianeti 
del sistema solare o da qualsiasi altra specifica raccolta di cose. Un insieme 
può anche essere infinito, come l’insieme dei numeri interi pari e, probabilmen¬ 
te, l’insieme di tutte le stelle. Se specifichiamo un insieme finito o infinito e poi 
consideriamo tutti i suoi « sottoinsiemi » (essi comprendono l’insieme stesso 
come pure l’insieme vuoto, privo di membri) come posti in relazione l’uno 
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all’altro per inclusione (così l’insieme jl, 2, 3j è incluso nell’insieme } 1, 2, 3, 
4, 5 j, possiamo costruire un’algebra di Boole di insiemi. 

Una notazione moderna per un’algebra di questo tipo usa lettere per insiemi, 
sottoinsiemi ed elementi. L’« insieme universale », il più grande insieme preso 
in considerazione, si indica con U. L’insieme vuoto o nullo si indica con 0. 
L’operazione di « unione » degli insiemi a e b (che dà la totalità degli elementi di a 
e di b) è indicata con U. (L’unione di {1, 2 J e di {3, 4, 5} è {1, 2, 3, 4, 5}). Per la 
« intersezione » degli insiemi a e b (tutti gli elementi comuni ad a e b) si usa 
il simbolo fi. (L’intersezione di {1, 2, 3j e }3, 4, 5j, è {3}.) Se due insiemi 
sono identici (per esempio l’insieme di numeri dispari è identico all’insieme di 
tutti gli interi che divisi per due danno resto 1) si usa il simbolo =. Il «com¬ 
plemento » dell’insieme a , costituito da tutti gli elementi dell’insieme universale 
che non sono in a, è indicato con a'. (Il complemento di (1, 2} rispetto all’in¬ 
sieme universale {1, 2, 3, 4, 5j è (3, 4, 5}.) La relazione binaria fondamentale 
di appartenenza di un elemento a un insieme è simbolizzata con e; a e b vuol 
dire che a è membro di b. Infine l’inclusione fra insiemi si indica con il sim¬ 
bolo c: a cz b indica che l’insieme a è incluso nell’insieme b (o che a è un 
sottoinsieme di b). 

I simboli impiegati da Boole comprendevano lettere per elementi, classi e 
sottoclassi, 1 per la classe universale, 0 per la classe nulla, + per l’unione di 
classi (che egli assumeva in senso « esclusivo » per significare quegli elementi 
delle due classi che non appartengono a entrambe; il passaggio al senso « in¬ 
clusivo » venne compiuto dal logico ed economista inglese W.S. Jevons, e presenta 
tali vantaggi che i logici seguenti lo adottarono), X per l’intersezione del¬ 
le classi, = per l’identità e il segno — per la sottrazione di un insieme da 
un altro. Per indicare il complemento di x, Boole scriveva 1 — x. Egli non 
dava un simbolo specifico per la relazione di inclusione fra classi ma avrebbe 
potuto esprimerla in vari modi, per esempio come a X b = a, affermando 
che l’intersezione di a e b è uguale ad a e quindi che la classe a è inclusa 
nella classe b. 

L’algebra di Boole di insiemi trova una elegante espressione grafica nei 
diagrammi di Venn (introdotti dal logico inglese John Yenn). I diagrammi di 
Venn sono la rappresentazione grafica di una interpretazione dell’algebra di 
Boole nella topologia degli insiemi di punti del piano. Indichiamo con due 
cerchi sovrapponentisi l’unione di due insiemi (si veda l’illustrazione in alto nella 
pagina a fronte), che supponiamo siano l’insieme dei numeri corrispondenti 
alle prime dieci cifre e l’insieme dei primi 10 numeri primi. Il rettangolo esterno 
rappresenta l’insieme universale, e questo comprende l’area esterna a entrambi 
i cerchi, ombreggiata per indicare che essa è l’insieme vuoto; è l’insieme vuoto 
perché siamo interessati solo agli elementi all’interno dei due cerchi. Questi 
16 elementi costituiscono l’unione dei due insiemi. L’area comune ai due cer¬ 
chi contiene l’intersezione. Essa consiste dell’insieme {2, 3, 5, 7j, cioè di quelle 
cifre che si trovano fra i primi 10 numeri primi. 

Adottando la convenzione di ombreggiare ogni area che sappiamo rappre¬ 
sentare un insieme vuoto, possiamo vedere come un diagramma di Venn a 
tre cerchi provi l’antico sillogismo così beffardamente citato da Russell. I tre 
cerchi sono utilizzati per indicare insiemi di uomini, di cose mortali e di So¬ 
crate (quest’ultimo è un insieme con un solo membro). La prima premessa, 
« Tutti gli uomini sono mortali », viene resa nel diagramma ombreggiando il 
cerchio degli uomini, per mostrare che la classe degli uomini non mortali è 
vuota (si veda l’illustrazione al centro nella pagina a fronte). 

La seconda premessa, « Socrate è un uomo », viene resa graficamente in mo¬ 
do analogo ombreggiando il cerchio di Socrate, per mostrare che la totalità 
di Socrate, vale a dire lui stesso, è all’interno del cerchio degli uomini (si veda 
l’illustrazione in basso nella pagina a fronte). Osserviamo ora il diagramma per 
vedere se la conclusione « Socrate è mortale » è valida. Lo è. La totalità di So¬ 
crate (la parte non ombreggiata del suo cerchio contrassegnata da un punto) è 
infatti dentro al cerchio delle cose mortali. 

La prima importante e nuova interpretazione dell’algebra di Boole venne 
suggerita da Boole stesso. Egli fece notare che se si interpretavano il suo 1 
come verità e il suo 0 come falsità, si poteva applicare il calcolo a enunciati 
che sono o veri o falsi. Boole non portò a termine questo programma, che fu 
portato avanti dai suoi successori e diede origine a quello che oggi si chiama 
calcolo proposizionale. Si tratta cioè del calcolo riguardante enunciati veri o 
falsi legati da relazioni binarie del tipo: « se p allora q », « o p o q ma non en¬ 
trambi », « o p o q o entrambi », « p se e solo se q », « né p né q », ecc. La 
tabella a pagina 69 mostra un confronto fra i simboli del calcolo proposizionale 
e i corrispondenti simboli dell’algebra di Boole di insiemi. 

E’ facile capire l’isomorfismo delle due interpretazioni prendendo in conside¬ 
razione il sillogismo su Socrate. Invece di dire « tutti gli uomini sono mortali », 
ragionando in termini di proprietà di classi o di inclusione di insiemi, asseriamo: 
« se x è un uomo allora x è mortale »; in questo modo enunciamo due propo¬ 
sizioni collegate mediante il « connettivo » chiamato « implicazione ». Ciò si può 
rendere graficamente mediante i diagrammi di Venn con lo stesso procedimento 
usato per il caso di « tutti gli uomini sono mortali ». In effetti tutte le relazioni 
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Soluzione al problema dell’aperitivo 
mediante i diagrammi di Venn. 
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CIRCUITO « E »: LA LAMPADA SI ACCENDE 
SOLO SE a E b SONO ENTRAMBI CHIUSI. 



X_X 


CIRCUITO « O .. INCLUSIVO: LA LAMPADA SI 
ACCENDE SOLO SE a O b O ENTRAMBI SONO 
CHIUSI. 



CIRCUITO « O » ESCLUSIVO: LA LAMPADA SI 
ACCENDE SOLO SE a O b, MA NON ENTRAMBI, 
SONO ABBASSATI. 



Circuiti per tre connettivi binari. 


binarie del calcolo proposizionale possono essere rese graficamente con i dia¬ 
grammi di Venn, e i diagrammi possono essere a loro volta usati per risolvere 
problemi semplici di calcolo. E’ un vero peccato che gli autori della maggior par¬ 
te dei testi introduttivi alla logica formale non si siano ancora resi conto di 
questo fatto. Essi continuano a usare i diagrammi di Venn per illustrare la 
vecchia logica di inclusione di classi, ma non li applicano al calcolo proposizio¬ 
nale, ove sono altrettanto efficienti. Anzi, sono perfino più efficienti, dal mo¬ 
mento che nel calcolo proposizionale non ci si occupa del « quantificatore esi¬ 
stenziale », il quale asserisce che una classe non è vuota perché le appartiene 
almeno un elemento. Nella logica tradizionale ciò era espresso dalla parola 
« qualche » (come in « qualche mela è verde »). Per tener conto di enunciati di 
questo tipo, Boole è stato costretto a ricorrere a procedure assai complicate 
e pesanti. 

Per vedere come i diagrammi di Venn risolvono facilmente alcuni tipi di 
rompicapi logici, si considerino le seguenti premesse relative a tre uomini 
d’affari, Altieri, Bianchi e Cisotti, che fanno colazione insieme ogni giorno 
feriale: 

1. Se Altieri ordina un aperitivo altrettanto fa Bianchi. 

2. Bianchi o Cisotti ordinano sempre un aperitivo, ma mai entrambi alla stessa 
colazione. 

3. Altieri o Cisotti o entrambi ordinano sempre un aperitivo. 

4. Se Cisotti ordina un aperitivo altrettanto fa Altieri. 

Per rappresentare questi enunciati con i diagrammi di Venn, identifichiamo 
il prendere un aperitivo con il vero e il non prenderlo con il falso. Le otto 
aree determinate dai cerchi sovrapponentisi, mostrate nell’illustrazione in basso 
nella pagina a fronte, sono contrassegnate per indicare tutte le possibili combinazio¬ 
ni di valori di verità, con a, b, c, che stanno per Altieri, Bianchi e Cisotti. Così 
l’area segnata con a, ~ b, c rappresenta Altieri e Cisotti che prendono l’aperitivo 
e Bianchi che non lo prende. Ombreggiando le aree che risultano vuote in 
base alle quattro premesse ed esaminando il risultato, il lettore può stabilire 
chi ordinerebbe l’aperitivo qualora egli facesse colazione con i tre uomini. La 
soluzione risulta particolarmente intuitiva se si procede nel modo seguente: 
si preparino quattro diagrammi colorati corrispondenti alle quattro premesse, 
come si vede alle figure 1, 2, 3 e 4 della pagina precedente, quindi sovrapponendo 
queste quattro figure si ottiene il diagramma della figura 5 da cui si ricava che, 
se le quattro premesse sono vere, l’unica combinazione possibile dei valori di 
verità è a, b e ~ c, ossia a vera, b vera e c falsa. Poiché si identifica la verità 
con l’ordinare un Martini, ciò significa che Altieri e Bianchi ordinano sem¬ 
pre Martini mentre Cisotti non lo fa mai. 

Tra i vari modi in cui può essere interpretata un’algebra di Boole vi è la 
struttura astratta chiamata « anello », o la struttura astratta chiamata « reticolo »: 
di entrambe l’algebra di Boole è un caso particolare. Possiede inoltre interpretazio¬ 
ni nell’analisi combinatoria, nella teoria dell’informazione, nella teoria dei grafi, 
nella teoria delle matrici e nelle teorie metamatematiche dei sistemi deduttivi 
in generale. In anni recenti l’interpretazione più utile è stata data nella teoria 
dei circuiti, che è importante nella progettazione dei calcolatori elettronici ma 
non è limitata ai circuiti elettrici. Si applica a qualsiasi tipo di trasmissione 
di energia lungo canali con apparati di connessione che permettono o interrom¬ 
pono il flusso all’energia o la deviano da un canale all’altro. 

L’energia può essere costituita da un flusso di gas o di liquido, come nei 
moderni sistemi di controllo a fluido, oppure da fasci luminosi. Può essere 
energia meccanica come nella macchina logica che Jevons inventò per risolvere 
problemi a quattro termini nell’algebra di Boole. Ancora, se gli abitanti di un 
altro pianeta avessero un senso dell’olfatto molto sviluppato, i loro calcolatori 
potrebbero usare la trasmissione di odori lungo tubi fino a sbocchi annusatori. 
Nella misura in cui l’energia percorre o non percorre un canale, si stabilisce 
un nesso tra questi due stati e i due valori di verità del calcolo proporzio¬ 
nale. Per ogni connettivo binario nel calcolo esiste un corrispondente cir¬ 
cuito di commutazione. Nell’illustrazione di questa pagina ne vengono presentati 
tre semplici esempi. Il circuito in basso è usato quando due interruttori molto 
distanti servono a controllare un’unica lampadina. E’ facile vedere che se la 
luce è spenta, cambiando lo stato di uno qualunque degli interruttori si accen¬ 
derà e che, se la luce è accesa, uno qualsiasi degli interruttori la spegnerà. 

Questa interpretazione dell’algebra di Boole mediante circuiti elettrici è 
stata suggerita in una rivista russa da Paul S. Ehrenfest nel 1910 e indipenden- 
dentemente, nel 1936, in Giappone; ma la prima pubblicazione importante, che 
introdusse tale interpretazione nell’ambiente dei progettatori di calcolatori, fu 
l’articolo di Claude E. Shannon A Symbolic Analysis of Relay and Switc’hing 
Circuits (<< Transactions of thè American Institute of Electrical Engineers », 
voi. 57, dicembre 1938). La pubblicazione era basata sulla tesi presentata dà 
Shannon al MIT, dove è ora professore di matematica. 

Dal tempo della pubblicazione dell’articolo di Shannon, l’algebra di Boole 
è diventata essenziale per la progettazione dei calcolatori, dove rende servizi 
particolarmente utili nella semplificazione dei circuiti allo scopo di risparmiare 
componenti. Un circuito è prima di tutto tradotto in un enunciato di logica 
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ALGEBRA BOOLEANA DI INSIEMI 

CALCOLO PROPOSIZIONALE 

U (INSIEME UNIVERSALE) 

V (VERO) 

0 (INSIEME VUOTO) 

F (FALSO) 

a, b, c, ... (INSIEMI, SOTTOINSIEMI, 
ELEMENTI) 

p, q, r, ... (PROPOSIZIONI) 

a u b (UNIONE: LA TOTALITÀ DI a E b)' 

P V q (DISGIUNZIONE: O p O p O ENTRAMBE 
SONO VERE) 

anb (INTERSEZIONE: ELEMENTI COMUNI 
AD a E 6) 

p • q (CONGIUNZIONE: p E q SONO EN¬ 
TRAMBE VERE) 

a = b (IDENTITÀ: a E b SONO LO STESSO 
INSIEME) 

n — n (EQUIVALENZA: p È VERA SE E SOLO 
K _ w SE È VERA q) 

a’ (COMPLEMENTO: TUTTI GLI ELEMEN¬ 

TI DI U CHE NON SONO IN a) 

~ P (NEGAZIONE: p È FALSA) 

a e b (APPARTENENZA: a È UN MEMBRO DI 
b) 

p= q (IMPLICAZIONE: SE p È VERA, q È 
VERA) 


Simboli corrispondenti in due interpretazioni dell’algebra di Boote 


simbolica; l’enunciato viene quindi « minimizzato » con metodi opportuni e infine 
ritradotto in un circuito più semplice. Naturalmente, nei moderni calcolatori, 
gli interruttori non sono più apparecchiature magnetiche o diodi a vuoto, ma 
transistori e altri piccolissimi semiconduttori. Per un certo periodo, dopo la pub¬ 
blicazione dello storico articolo di Shannon, la maggior parte del lavoro intorno 
alla logica della progettazione dei calcolatori è stata fatta senza comunicazione 
fra gli esperti dei vari paesi. Gerard Piel nel suo libro Science in thè Cause 
of Man (Knopf, 1961) dà notizia che i matematici americani impiegati presso 
molte grosse società lavorarono per cinque anni, con un costo di circa 200.000 
dollari, per ottenere risultati che erano già stati pubblicati in Russia prima 
che essi cominciassero. 

E ora un’ultima interpretazione dell’algebra di Boole che è un’autentica cu¬ 
riosità. Si consideri il seguente insieme di otto numeri: {1, 2, 3, 5, 6, 10, 15, 30 j. 
Sono i divisori di 30, compresi 1 e 30 (che possiamo chiamare divisori « im¬ 
propri »). Interpretiamo l’« unione » come il minimo comune multiplo di ogni 
coppia di questi numeri e l’« intersezione » di una coppia come il massimo comun 
divisore. L’inclusione insiemistica diventa la relazione « è divisore di ». L’insieme 
universale è 30, l’insieme vuoto è 1. Il complemento di un numero a è 30/a. 
Con queste nuove interpretazioni delle relazioni booleane si ottiene ancora una 
struttura booleana consistente! Tutti i teoremi dell’algebra di Boole hanno i lo¬ 
ro corrispettivi in questo curioso sistema basato sui divisori di 30. Per esempio, 
nell’algebra di Boole il complemento del complemento di a è semplicemente a, 
o nell’interpretazione del calcolo proposizionale la negazione di una negazione 
è lo stesso che se non ci fossero negazioni. Più in generale, solo una serie dispari 
di negazioni equivale a una negazione. Applichiamo questa legge booleana al 
numero 3. Il suo complemento è 30/3 = 10. Il complemento di 10 è 30/10 = 3, 
il che ci riporta di nuovo a 3. 

Consideriamo due famose leggi booleane chiamate leggi di De Morgan. 
Nell’algebra degli insiemi esse assumono la forma: 

(a U b)' = a' fi b’ 

(a n by = a' U b'. 

Nel calcolo proposizionale: 

~ (aV b) = ~ a ■ ~ b 
~ (a • b) = ~aV~A 

Se il lettore sostituisce due qualunque divisori di 30 al posto di a e b, e in¬ 
terpreta i simboli come spiegato prima, troverà che le leggi di De Morgan so¬ 
no valide. Le leggi di De Morgan possono servire a illustrare il famoso principio 
di dualità dell’algebra di Boole. Se in ogni enunciato si scambiano (se e ovunque 
compaiano) l’unione con l’intersezione, l’insieme universale con quello nullo, e 
si inverte la direzione dell’inclusione insiemistica, il risultato è un’altra legge 
valida. Inoltre, questi cambiamenti possono essere fatti in ogni passo della di¬ 
mostrazione di una legge per ottenere una dimostrazione valida dell’altra! (Un 
principio di dualità altrettanto interessante vale in geometria proiettiva rispetto 
a scambi di linee e punti.) 



Diagramma di Venn per il rompicapo 
dell’aperitivo. 
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Verità e dimostrazione 

L'antinomia del mentitore, noto ostacolo a una definizione di verità nei 
linguaggi naturali, è usata costruttivamente nei linguaggi formalizzati 
per concludere che non tutte le proposizioni vere possono essere dimostrate 


di Alfred Tarski 


L ’argomento di questo articolo non 
è nuovo. Esso è stato trattato 
molto di frequente nella moder¬ 
na letteratura logica e filosofica, e non 
sarebbe facile portare qualche contri¬ 
buto originale alla discussione. Per mol¬ 
ti lettori, temo, nessuna delle idee a- 
vanzate in questo articolo risulterà es¬ 
senzialmente nuova. Nondimeno, la 
mia speranza è che essi possano tro¬ 
vare qualche interesse nella maniera 
in cui il materiale è stato disposto e 
articolato. 

Come indica il titolo, intendo qui 
esaminare due concetti diversi ma con¬ 
nessi fra loro: il concetto di verità e 
quello di dimostrazione. L’articolo si 
divide in tre paragrafi; nel primo viene 
trattato il concetto di verità, nel se¬ 
condo il concetto di dimostrazione e 
nel terzo si considerano le relazioni fra 
questi due concetti. 

Il concetto di verità 

Il compito di spiegare il significato 
del termine « vero » sarà qui interpre¬ 
tato in modo restrittivo. Il concetto di 
verità compare in molti contesti diversi 
e ci sono varie categorie di oggetti al¬ 
le quali può essere riferito il termine 
« vero »: in un contesto psicologico si 
può parlare sia di emozioni vere sia 
di credenze vere; in un contesto este¬ 
tico si può analizzare la verità inte¬ 
riore di un oggetto d’arte. Ma in que¬ 
sto articolo ci interessa solo ciò che 
potrebbe chiamarsi il concetto logico 
di verità. Più esattamente ci interessa 
esclusivamente il significato della pa¬ 
rola « vero » usata in riferimento a una 
proposizione. Presumibilmente, questo 
era appunto l’uso originale del termi¬ 
ne « vero » nel linguaggio umano. Le 
proposizioni vengono trattate qui come 
oggetti linguistici, come certe succes¬ 
sioni finite di suoni o di segni scritti. 
(Naturalmente non tutte le successioni 


siffatte sono proposizioni). Inoltre, 
quando parleremo di proposizioni in¬ 
tenderemo sempre quelle che in gram¬ 
matica sono chiamate proposizioni di¬ 
chiarative, e non altri tipi di proposi¬ 
zioni cóme ad esempio quelle interro¬ 
gative o imperative. 

Ogni volta che si precisa il signifi¬ 
cato di un termine tratto dal linguag¬ 
gio quotidiano, si dovrebbe tener pre¬ 
sente che lo scopo e lo status logico di 
una tale spiegazione può variare da un 
caso all’altro. Per esempio, la spiega¬ 
zione può essere intesa come un reso¬ 
conto dell’uso effettivo del termine in 
questione e in tal caso ha senso do¬ 
mandarsi se il resoconto sia corretto. 
In altri casi la spiegazione può essere 
di natura normativa, ossia può essere 
fornita come indicazione circa l’uso 
del termine in modo ben definito, sen¬ 
za tuttavia pretendere che il suggeri¬ 
mento si adegui al modo in cui il ter¬ 
mine viene effettivamente usato nella 
pratica; una tale spiegazione può esse¬ 
re valutata, per esempio, dal punto di 
vista della sua utilità anziché da quel¬ 
lo della sua correttezza. E si potrebbe 
continuare. La spiegazione che dare¬ 
mo noi partecipa, entro certi limiti, di 
entrambi gli aspetti. Ciò che viene pro¬ 
posto può essere trattato, in linea di 
principio, come suggerimento di usa¬ 
re il termine « vero » in un certo mo¬ 
do definito, ma, al tempo stesso, ci 
conforta l’opinione che la nostra pro¬ 
posta sia in accordo con l’uso corren¬ 
te del termine nel linguaggio quoti¬ 
diano. 

La nostra interpretazione del concet¬ 
to di verità si accorda nella sostanza 
con varie spiegazioni di tale concetto 
che si trovano nella letteratura filoso¬ 
fica. La più antica spiegazione si tro¬ 
va forse nella Metafìsica di Aristotele: 

Dire di ciò che è che non è, o di 

ciò che non è che è, è falso, men¬ 


tre dire di ciò che è che è o di 
ciò che non è che non è, è vero. 

Qui e in quanto segue la parola « fal¬ 
so » ha lo stesso significato dell’espres¬ 
sione « non vero » e può essere da 
questa sostituita. 

Il contenuto intuitivo della formula¬ 
zione aristotelica risulta piuttosto chia¬ 
ro. Tuttavia la formulazione lascia al¬ 
quanto a desiderare dal punto di vista 
della precisione e della correttezza for¬ 
male. Anzitutto non è sufficientemente 
generale; essa si riferisce solo a propo¬ 
sizioni che « dicono», di qualche cosa, 
« che è » o « che non è » ; nella mag¬ 
gior parte dei casi sarebbe ben diffi¬ 
cile far rientrare una proposizione in 
questo schema senza distorcerne il sen¬ 
so e forzare lo spirito del linguaggio. 
Questa è forse una delle ragioni per 
cui nella filosofia moderna sono state 
proposte varie alternative a quella di 
Aristotele. Come esempi citiamo i se¬ 
guenti: 

Una proposizione è vera se deno¬ 
ta lo stato di cose esistente. 

La verità di una proposizione 
consiste nella sua corrispondenza 
con la realtà. 

Grazie all’uso di termini filosofici 
tecnici, queste formulazioni hanno in¬ 
dubbiamente un tono molto « dotto ». 
È tuttavia mia impressione che una 
volta analizzate più da vicino, le nuo¬ 
ve formulazioni risultino meno chiare 
e più ambigue di quella avanzata da 
Aristotele. 

La concezione della verità che trova 
la sua espressione nella formulazione 
aristotelica (e in altre più recenti for¬ 
mulazioni a essa collegate) viene di so¬ 
lito chiamata classica o concezione se¬ 
mantica della verità. Per sematica si 
intende quella parte della logica che, 
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grosso modo, tratta le relazioni fra gli 
oggetti linguistici (quali le proposizio¬ 
ni) e ciò che tali oggetti esprimono. Il 
carattere semantico del termine « ve¬ 
ro » viene chiaramente rilevato dalla 
spiegazione proposta da Aristotele e da 
alcune formulazioni che daremo più 
avanti. A volte si parla della teoria 
basata sulla concezione classica come 
della teoria corrispondentistica della ve¬ 
rità. 

(Nella moderna letteratura filosofica 
sono state trattate anche altre conce¬ 
zioni e teorie della verità, come la con¬ 
cezione pragmatica e la teoria della 
coerenza. Queste concezioni sembrano 
avere carattere esclusivamente norma¬ 
tivo e hanno scarsa connessione con 
l’uso effettivo del termine « vero »; 
nessuna di esse è stata finora formulata 
con un minimo di chiarezza e preci¬ 
sione. Nel presente articolo esse non 
verranno esaminate.) 

Cercheremo qui di ottenere una più 
precisa spiegazione del concetto classi¬ 
co di verità, una che possa superare la 
formulazione aristotelica pur conser¬ 
vandone gli intenti di fondo. A questo 
scopo, dovremo ricorrere ad alcune 
tecniche della logica contemporanea 
e dovremo specificare il linguaggio nel 
quale sono formulate le proposizioni 
che ci interessano. Ciò è necessario, 
non fosse altro per la ragione che una 
successione di suoni o di segni che 
in un linguaggio sia una proposizione 
vera o falsa, ma comunque sensata, 
può risultare priva di significato in un 
altro linguaggio. Per il momento sup¬ 
poniamo che il linguaggio che ci inte¬ 
ressa sia l’italiano. 

Cominciamo con un problema sem¬ 
plice. Consideriamo una proposizione 
italiana il cui significato non dia adito 
a dubbi, per esempio « la neve è bian¬ 
ca ». Per brevità denotiamo questa pro¬ 
posizione con « S », cosicché « S » di¬ 
venta il nome di una proposizione. Ci 
domandiamo: cosa intendiamo dicen¬ 
do che S è vera o che è falsa? La ri¬ 
sposta è semplice: in conformità con la 
spiegazione aristotelica, dicendo che S 
è vera intendiamo semplicemente che 
la neve è bianca, e dicendo che S è 
falsa intendiamo che la neve non è 
bianca. Eliminando il simbolo « S » ar¬ 
riviamo alla seguente formulazione: 

(1) «La neve è bianca» è vera se 
e solo se la neve è bianca. 

(1’) «La neve è bianca» è falsa se 
e solo se la neve non è bianca. 

Cosi la (1) e la (1’) forniscono spie¬ 
gazioni soddisfacenti del significato dei 
termini « vero » e « falso » quando 
questi termini sono riferiti alla propo¬ 
sizione « la neve è bianca ». Possiamo 


considerare la (1) e la (E) come defi¬ 
nizioni parziali dei termini « vero » e 
« falso », anzi come definizioni di que¬ 
sti termini in relazione a una partico¬ 
lare proposizione. Si noti che la (1), 
cosi come la (1’), ha la forma richiesta 
dalle regole della logica per una defini¬ 
zione, precisamente la forma di una e- 
quivalenza logica: essa consta di due 
parti, il primo e il secondo membro 
dell’equivalenza, collegati dal connetti¬ 
vo « se e solo se ». Il primo membro 
è il definiendum, la frase il cui signifi¬ 
cato viene spiegato dalla definizione; il 
secondo membro è il definiens, la fra¬ 
se che fornisce la spiegazione. Nel no¬ 
stro caso il definiendum è la seguente 
espressione: 

« la neve è bianca » è vera ; 
il definiens ha la forma: 

«la neve è bianca». 

Può sembrare a prima vista che la 
(1), considerata come definizione, pre¬ 
senti una pecca essenziale ampiamente 
discussa nella logica tradizionale: un 
circolo vizioso; e ciò perché alcune pa¬ 
role, per esempio « neve », compaiono 
sia nel definiens sia nel definiendum. 
In realtà, tuttavia, la parola compare 
nel primo caso con carattere essen¬ 
zialmente diverso che nel secondo. La 
parola « neve » è una parte sintattica 
o organica del definiens; precisamente, 
il definiens è una proposizione il cui 
soggetto è appunto « neve ». Anche il 
definiendum è una proposizione, ed 
esprime il fatto che il definiens è una 
proposizione vera. Il suo soggetto è un 
nome del definiens, ottenuto mettendo 
il definiens stesso fra virgolette. (Quan¬ 
do si predica qualcosa di un oggetto, 
si usa sempre il nome di questo ogget¬ 
to e non l’oggetto stesso: questo vale 
anche per gli oggetti linguistici.) Per 
varie ragioni un’espressione fra virgo- 
lette va trattata come una parola sola 
senza parti sintattiche. Perciò la paro¬ 
la « neve » che indubbiamente compa¬ 
re nel definiendum come una parte, 
non vi compare come componente sin¬ 
tattica. La logica medievale direbbe 
che nel definiens « neve » compare in 
suppositione formali e nel definiendum 
compare in suppositione materiali. Co¬ 
munque, le parole che non sono parti 
sintattiche del definiendum non posso¬ 
no dare luogo a un circolo vizioso, e 
quindi questo pericolo scompare. 

Le precedenti osservazioni toccano 
alcune questioni che sono piuttosto sot¬ 
tili e tutt’altro che semplici dal punto 
di vista logico. Anziché soffermarsi su 
di esse indicherei un altro modo per 
dissipare ogni timore di circolo vizio¬ 


so. Nel formulare la (1) abbiamo ap¬ 
plicato un metodo comune per otte¬ 
nere un nome di una proposizione, o 
di una qualunque espressione: quello 
che consiste nel mettere l’espressione 
fra virgolette. Il metodo ha molti pre¬ 
gi, ma è anche all’origine delle difficol¬ 
tà discusse sopra. Per rimuovere que¬ 
ste difficoltà, tentiamo di adottare un 
altro metodo per formare nomi di e- 
spressioni e precisamente un metodo 
che potrebbe essere caratterizzato co¬ 
me una descrizione lettera per lettera 
di un’espressione. Usando questo me¬ 
todo anziché la (1), avremmo la se¬ 
guente formulazione più tediosa: 

(2) La successione di quattro parole, 
la prima delle quali è la succes¬ 
sione delle lettere Elle e A, la 
seconda è la successione delle let¬ 
tere Enne, E, Vi ed E, la terza 
è costituita dalla sola lettera E ac¬ 
centata, e infine la quarta è la suc¬ 
cessione costituita dalle lettere Bi, 

I, A, Enne, Ci e A, è una pro¬ 
posizione vera se e solo se la neve 
è bianca. 

La formulazione (2) non differisce 
dalla (1) nel suo significato; la (1) può 
essere considerata semplicemente come 
una forma della (2). La nuova formu¬ 
lazione è certamente meno perspicua 
della vecchia, ma ha su di essa il van¬ 
taggio di non creare il sospetto di un 
circolo vizioso. 

Naturalmente definizioni parziali di 
verità analoghe alla (1) oppure alla 

(2) possono essere formulate anche per 
altre proposizioni. Ciascuna di queste 
definizioni ha la forma: 

(3) «p» è vera se e solo se p, 

dove « p » va sostituito in ambedue i 
membri della (3) con la proposizione 
per la quale si costruisce la definizione. 
Si dovrebbe, tuttavia, usare particolare 
cura in quelle situazioni nelle quali la 
proposizione posta in luogo di « p » 
contenga la parola « vero » come parte 
sintattica. In tali casi la corrispondente 
equivalenza (3) non può essere consi¬ 
derata come definizione parziale di ve¬ 
rità, giacché, se fosse considerata co¬ 
me tale, costituirebbe ovviamente un 
circolo vizioso. Anche in questi casi, 
tuttavia, la (1) è una proposizione sen¬ 
sata, anzi è addirittura vera dal punto 
di vista della concezione classica di ve¬ 
rità. A titolo di illustrazione immagi¬ 
niamo che in una recensione di un li¬ 
bro si trovi la seguente proposizione: 

(4) Non ogni proposizione in questo 
libro è vera. 

Applicando il criterio aristotelico 
si vede che la proposizione (4) è ve- 
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ra se, di fatto, non ogni proposizione 
del libro in questione è vera e che la 
(4) è altrimenti falsa; in altre parole, 
possiamo enunciare l’equivalenza ot¬ 
tenuta dalla (3) sostituendo la (4) in 
luogo di « p ». Naturalmente questa 
equivalenza si limita a enunciare le 
condizioni sotto le quali la proposizio¬ 
ne (4) è vera o non vera, ma l’equiva¬ 
lenza da sola non ci permette di de¬ 
cidere quale dei due casi si verifichi 
in realtà. Per verificare il giudizio e- 
spresso dalla (4) uno dovrebbe leggere 
attentamente il libro recensito e ana¬ 
lizzare la verità delle proposizioni in 
esso contenute. 

Alla luce della precedente discussio¬ 
ne possiamo ora riformulare il nostro 
problema centrale. Conveniamo che 
l’uso del termine « vero » in riferimen¬ 
to alle proposizioni italiane è confor¬ 
me al concetto classico di verità quan¬ 
do e soltanto quando ci permette di 
stabilire ogni equivalenza della forma 
(3) in cui « p » sia sostituita in ambo i 
membri da un’arbitraria proposizione 
italiana. Se questa condizione è soddi¬ 
sfatta, diremo semplicemente che l’uso 
del termine « vero » è adeguato. Cosi 
il nostro problema principale è il se¬ 
guente: è possibile stabilire un uso ade¬ 
guato del termine « vero » per le pro¬ 
posizioni italiane e, in tal caso, me¬ 
diante quali metodi? Naturalmente si 
può sollevare una questione analoga 
per le proposizioni di una qualsiasi al¬ 
tra lingua. 

Il problema sarà risolto compieta- 
mente se riusciremo a costruire una de¬ 
finizione generale di verità che sia ade¬ 
guata nel senso che ne deriveranno, 
come conseguenze logiche, tutte le e- 
quivalenze della forma (3). Se una tale 
definizione è accettata dalle persone 
che parlano italiano, essa stabilisce ov¬ 
viamente un uso adeguato del termine 
« vero ». 

Sotto certe ipotesi particolari la co¬ 
struzione di una definizione generale 
di verità è facile. Si supponga infatti 
di essere interessati non già alla lingua 
italiana nel suo complesso, ma solo a 
una sua porzione e di voler definire il 
termine « vero » esclusivamente in ri¬ 
ferimento alle proposizioni di questo 
linguaggio parziale; chiameremo lin¬ 
guaggio L questa porzione della lingua 
italiana. Supponiamo inoltre che L ven¬ 
ga corredato di precise regole sintatti¬ 
che che ci permettano, in ciascun caso 
particolare, di distinguere una propo¬ 
sizione da un’espressione che non lo e, 
e che il numero di tutte le proposizioni 
del linguaggio L sia finito (eventual¬ 
mente molto grande). Si supponga, in¬ 
fine, che la parola « vero » non com¬ 
paia in L e che il significato di tutte le 
parole in L sia sufficientemente chiaro. 


si da evitare ogni obiezione sull’uso del¬ 
le medesime per definire la verità. 

Sotto queste ipotesi si proceda come 
segue. Anzitutto prepariamo un elen¬ 
co completo di tutte le proposizioni di 
L; supponiamo per esempio che ci sia¬ 
no mille proposizioni in L e convenia¬ 
mo di usare i simboli « Sj », « s 2 », ..., 
« S 1000 ;> come abbreviazioni delle suc¬ 
cessive proposizioni dell’elenco. Poi, 
per ciascuna delle proposizioni « s, », 
« s 2 », ..., « s lm » costruiamo una defini¬ 
zione parziale di verità sostituendo suc¬ 
cessivamente queste proposizioni a « p » 
in ambo i membri dello schema (3). 
Infine formiamo la congiunzione logi¬ 
ca di tutte queste definizioni parziali, 
cioè combiniamole in un unico enun¬ 
ciato mettendo il connettivo « e » in 
mezzo a ciascuna coppia di definizioni 
parziali consecutive. L’unica cosa che 
resta da fare è di dare alla congiun¬ 
zione risultante una forma diversa, ma 
logicamente equivalente, in modo da 
soddisfare i requisiti formali richiesti 
alle definizioni dalle regole della logica. 

(5) Per ogni proposizione x (del lin¬ 
guaggio L), x è vera se e solo se 
s,, e x coincide con « Si » 
oppure 

s 2 , e x coincide con « Si » 
oppure 

oppure infine 

Siooo, e x coincide con ^ Siooo ». 

Siamo giunti cosi a un enunciato che 
può ben costituire la desiderata defini¬ 
zione generale di verità: essa è formal¬ 
mente corretta e è adeguata nel senso 
che implica tutte le equivalenze della 
forma (3) nelle quali « p » è stata so¬ 
stituita da una qualunque proposizione 
del linguaggio L. Notiamo, per inciso, 
che la (5) è una proposizione della lin¬ 
gua italiana, ma ovviamente non del 
linguaggio L; giacché la (5) contiene 
tutte le proposizioni di L come parti 
proprie, non può coincidere con al¬ 
cuna di esse. Un’ulteriore disamina ser¬ 
virà a meglio chiarire questo punto. 

Per ovvie ragioni il procedimento so¬ 
pra descritto non si può applicare se si 
è interessati a tutta la lingua italiana, e 
non semplicemente a una sua porzione. 
Già se tentiamo di preparare un elen¬ 
co completo delle proposizioni italia¬ 
ne, incontriamo la difficoltà che le re¬ 
gole della grammatica italiana non de¬ 
terminano in modo preciso la forma 
delle espressioni (successioni finite di 
parole) che vanno riguardate come pro¬ 
posizioni: un’espressione particolare, di¬ 
ciamo un’esclamazione, può fungere da 
proposizione in un dato contesto, men¬ 
tre un’espressione della stessa forma 


non lo sarà in un contesto diverso. Di 
più, l’insieme di tutte le proposizioni 
italiane è almeno potenzialmente infi¬ 
nito. È certamente vero che al mo¬ 
mento attuale sono state pronunciate e 
scritte solo un numero finito di propo¬ 
sizioni dagli esseri umani: probabilmen¬ 
te nessuno sarebbe dell’avviso, però, 
che l’elenco di queste proposizioni esau¬ 
risca tutte le proposizioni italiane. Al 
contrario, vedendo un tale elenco, cia¬ 
scuno di noi potrebbe facilmente esi¬ 
bire una proposizione italiana che non 
si trovi già in esso. Infine il fatto che 
la parola « vero » compaia nella lin¬ 
gua italiana è sufficiente a impedire 
un’applicazione del procedimento de¬ 
scritto sopra. 

Dalle precedenti osservazioni non se¬ 
gue che non si possa ottenere per qual¬ 
che altra via la desiderata definizione 
di verità per proposizioni italiane ar¬ 
bitrarie. C’è, tuttavia, una ragione più 
seria e fondamentale che sembra pre¬ 
cludere una tale possibilità. Di più, la 
mera ipotesi che si possa trovare me¬ 
diante un qualunque metodo un uso 
adeguato del termine « vero » (in rife¬ 
rimento a proposizioni italiane arbitra¬ 
rie) conduce chiaramente a una con¬ 
traddizione. Il ragionamento più sem¬ 
plice per ottenere una tale contraddi¬ 
zione è noto come antinomia del men¬ 
titore'. ; lo descriveremo ora brevemente. 

Si consideri la proposizione: 

(6) La proposizione stampata in co¬ 
lore a pagina 72 del libro Veri- 
rità e dimostrazione è falsa. 

Conveniamo di usare « s » come ab¬ 
breviazione per questa proposizione. 
Controllando il titolo di questo libro 
e il numero di questa pagina, si riscon¬ 
tra facilmente che « s » è proprio l’uni¬ 
ca proposizione stampata in colore a 
pagina 72 del libro Verità e dimostra¬ 
zione. Ne segue in particolare che 

(7) «ss è falsa se e solo se la pro¬ 
posizione stampata in colore a 
pagina 72 del libro Verità e di¬ 
mostrazione è falsa. 

D’altra parte « s » è indubbiamente 
una proposizione italiana. Perciò, sup¬ 
ponendo che l’uso del termine « vero » 
sia adeguato, possiamo stabilire l’equi 
valenza (3) in cui « p » sia sostituito 
con «5». Cosi possiamo affermare: 

( 8 ) « s » è vera se e solo se s. 

Ricordiamo ora che « s » sta per l’in¬ 
tera proposizione (6). Quindi possiamo 
sostituire « s » con la (6) nel secondo 
membro della (8); si ottiene allora: 
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(9) « s » è vera se e solo se la pro¬ 
posizione stampata in colore a 
pagina 72 del libro Verità e di¬ 
mostrazione è falsa. 

Confrontando ora la (7) con la (9) si 
conclude: 

(10) «s» è falsa se e solo se «s» è 
vera. 

Ciò conduce a un’ovvia contraddi¬ 
zione: « s » risulta sia vera che falsa, 
e siamo cosi di fronte a un’antinomia. 
La formulazione sopra riportata del¬ 
l’antinomia del mentitore è dovuta al 
logico polacco Jan Lukasiewicz. 

Sono note anche formulazioni più 
elaborate dell’antinomia. Immaginia¬ 
mo, per esempio, un libro di cento pa¬ 
gine contenente una e una sola pro¬ 
posizione per ciascuna pagina. A pagi¬ 
na 1 si legge: 

La proposizione stampata a pagi¬ 
na 2 di questo libro è vera. 

A pagina 2 si legge: 

La proposizione stampata a pagi¬ 
na 3 di questo libro è vera. 

E così via fino a pagina 99. A pagina 
100, l’ultima pagina, troviamo: 

La proposizione stampata a pagi¬ 
na 1 di questo libro è falsa. 

Supponiamo che la proposizione stam¬ 
pata a pagina 1 sia davvero falsa. Me¬ 
diante un ragionamento non difficile 
ma molto lungo e che richiede di sfo¬ 
gliare tutto il libro, si conclude che la 
nostra supposizione è errata. Di conse¬ 
guenza supponiamo che la proposizione 
stampata a pagina 1 sia vera e, con 
un ragionamento altrettanto facile e 
lungo del precedente, ci si convince che 
anche la nuova supposizione è erra¬ 
ta. Cosi ci troviamo di nuovo di fronte 
a un’antinomia. 

Non è difficile comporre molti altri 
libri antinomici che siano varianti di 
quello descritto. Ammettiamo che cia¬ 
scuno di essi abbia 100 pagine, cia¬ 
scuna delle quali contenga una e una 
sola proposizione della forma: 

La proposizione stampata a pagi¬ 
na 00 di questo libro è XX, 

dove in ciascun caso particolare « XX » 
va sostituito con una delle parole « ve¬ 
ra » o « falsa », mentre « 00 » va so¬ 
stituito con uno dei numerali « 1 », 
«2 », ..., « 100 »; non si esclude che lo 
stesso numerale compaia in più pagi¬ 
ne. Non è detto che ogni variante com¬ 
posta secondo queste regole dia effet¬ 


tivamente luogo a un’antinomia. Il let¬ 
tore che ama i rompicapo logici non 
troverà difficile descrivere tutte quelle 
varianti che fanno al caso nostro. La 
seguente avvertenza può risultare utile 
al riguardo: si immagini che a qualche 
punto del libro, diciamo a pagina 1, si 
dica che la proposizione a pagina 3 è 
vera, mentre in qualche altro punto, 
diciamo a pagina 2, si affermi che la 
stessa proposizione è falsa. Da queste 
informazioni non segue affatto che il li¬ 
bro sia « antinomico »; se ne può solo 
dedurre che o è falsa la proposizione di 
pagina 1 o quella di pagina 2. Un'antino¬ 
mia sorge, invece, ogniqualvolta si sia 
in grado di dimostrare che una delle 
proposizioni del libro è sia vera sia 
falsa, indipendentemente da ogni ipote¬ 
si sulla verità o falsità delle rimanenti 
proposizioni. 

L’antinomia del mentitore risale al¬ 
l’antichità. Di solito viene attribuita al 
logico greco Eubulide; essa ha tormen¬ 
tato molti logici antichi e ha causato 
la morte prematura di almeno uno di 
essi, Fileta di Coo. Altre antinomie e 
paradossi furono scoperti nell’antichi¬ 
tà, nel medioevo e in tempi recenti. 
Sebbene molte di esse siano ormai com¬ 
pletamente dimenticate, l’antinomia del 
mentitore viene ancora analizzata e di¬ 
scussa negli scritti contemporanei. As¬ 
sieme ad alcune recenti antinomie sco¬ 
perte all’inizio del secolo (in partico¬ 
lare l’antinomia di Russell), essa ha 
avuto un grande influsso sullo svilup¬ 
po della logica moderna. 

Nella letteratura sull’argomento si 
incontrano due modi diametralmente 
oppòsti di affrontare le antinomie. Uno 
è quello di ignorarle, di trattarle come 
sofismi, come giochi che non sono seri 
ma maliziosi e che mirano soprattutto 
a dimostrare l’ingegnosità di chi le for¬ 
mula. L’atteggiamento opposto è carat¬ 
teristico di certi pensatori del XIX se¬ 
colo e è ancora presente o lo era fino 
a poco tempo fa. Secondo questo mo¬ 
do di vedere, le antinomie costituisco¬ 
no un elemento essenziale del pensiero 
umano: esse continueranno a compa¬ 
rire nelle attività intellettuali e la loro 
presenza è la fonte basilare del vero 
progresso. Come spesso accade, la ve¬ 
rità è probabilmente una via di mezzo. 
Personalmente, come logico, non pos¬ 
so persuadermi che le antinomie siano 
un elemento permanente del nostro si¬ 
stema di conoscenze’ tuttavia non sono 
affatto incline a prendere le antinomie 
alla leggera'. La comparsa di un’anti¬ 
nomia è per me un sintomo di malat¬ 
tia: partendo da premesse che sembra¬ 
no intuitivamente ovvie, usando forme 
di ragionamento che intuitivamente 
sembrano sicure, un’antinomia ci con¬ 
duce a conclusioni assurde, contraddit¬ 


torie. Ogni volta che ciò accade, dob¬ 
biamo sottoporre i nostri modi di pen¬ 
sare a una revisione approfondita, ri¬ 
nunciare a certe premesse, alle quali 
credevamo, oppure migliorare certe for¬ 
me di ragionamento che eravamo abi¬ 
tuati a usare. E questo lo facciamo 
nella speranza non solo di liberarci del¬ 
l’antinomia, ma anche di non incon¬ 
trarne di nuove. A questo scopo met¬ 
tiamo alla prova il nostro pensiero co¬ 
si riveduto con tutti i mezzi a disposi¬ 
zione, e per prima cosa cerchiamo di 
ricostruire la vecchia antinomia nella 
nuova sistemazione; queste prove costi¬ 
tuiscono un’attività molto importante 
nel campo del pensiero speculativo, si¬ 
mile a quella di condurre a termine 
degli esperimenti cruciali nella scienza 
empirica. 

Da questo punto di vista consideria¬ 
mo ora in particolare l’antinomia del 
mentitore. Nell’antinomia interviene il 
concetto di verità in riferimento a pro¬ 
posizioni arbitrarie della lingua italia¬ 
na; essa potrebbe facilmente essere ri¬ 
formulata in modo da applicarsi ad al¬ 
tri linguaggi naturali. Ci troviamo di 
fronte a un serio problema: come si 
possono evitare le contraddizioni in¬ 
dotte da questa antinomia? Una solu¬ 
zione radicale del problema che può 
subito venire in mente è semplicemen¬ 
te quella di abolire la parola « vero » 
dal vocabolario italiano o per lo meno 
di trattenersi dall’usarla in ogni seria 
questione. 

Coloro ai quali una tale mutilazio¬ 
ne dell’italiano sembra altamente insod¬ 
disfacente e illegittima possono essere 
inclini ad accettare una soluzione di 
compromesso, che consiste nell’adotta- 
re ciò che potrebbe chiamarsi (secondo 
il filosofo polacco contemporaneo Ta- 
deusz Kotarbinski) « la concezione ni¬ 
chilista della teoria della verità ». Se¬ 
condo questa concezione la parola 
« vero » non ha un significato indipen¬ 
dente, ma può essere usata come com¬ 
ponente delle due espressioni sensate 
« è vero che » e « non è vero che ». 
Queste espressioni vengono trattate co¬ 
me se fossero singole parole, senza 
parti organiche. Il significato a esse 
attribuito è tale che possano essere im¬ 
mediatamente eliminate da ogni pro¬ 
posizione in cui compaiano. Per esem¬ 
pio, anziché dire 

è vero che tutti i gatti sono neri 
si può semplicemente dire 

tutti i gatti sono neri 
e invece che 

non è vero che tutti i gatti siano 

neri 
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si può dire 

non tutti i gatti sono neri. 

In altri contesti la parola « vero » è 
priva di senso. In particolare, non può 
essere usata come un vero predicato 
che qualifica nomi di proposizioni. Nel¬ 
la terminologia della logica medievale 
possiamo dire che la parola « vero » si 
può usare come parola sincategorema- 
tica in alcune situazioni particolari, ma 
non la si può mai usare in modo cate- 
gorematico. 

Per rendersi conto delle implicazio¬ 
ni di questa concezione, si consideri la 
proposizione che è stata il punto di 
partenza per il paradosso del menti¬ 
tore, cioè la proposizione stampata in 
colore a pagina 72 di questo libro. Dal 
punto di vista « nichilista » essa non 
è una proposizione sensata e l’antino¬ 
mia semplicemente svanisce. Disgra¬ 
ziatamente, anche molti altri usi della 
parola « vero », che altrimenti sem¬ 
brano pienamente legittimi e ragione¬ 
voli, restano parimenti colpiti da que¬ 
sta concezione. Immaginiamo, per e- 
sempio, che un certo termine che si 
ripete frequentemente nelle opere di un 
matematico antico ammetta diverse in¬ 
terpretazioni. Uno storico della scien¬ 
za che studia tali opere giunge alla 
conclusione che sotto una di queste in¬ 
terpretazioni tutti i teoremi enunciati 
dal matematico risultano veri; ciò lo 
conduce in modo naturale alla conget¬ 
tura che la stessa cosa valga per cia¬ 
scuno dei lavori di questo matematico 
che sono sconosciuti al presente ma 
che possono essere scoperti in futuro. 
Se però lo storico della scienza condi¬ 
vide la concezione « nichilista » della 
verità, perde per ciò stesso la possi¬ 
bilità di esprimere a parole la sua con¬ 
gettura. Si potrebbe dire che la teoria 
« nichilista » della verità rende un 
omaggio ipocrita a certe forme del lin¬ 
guaggio umano entrate nelle consuetu¬ 
dini, mentre in realtà abolisce l’idea di 
verità dal patrimonio concettuale della 
mente umana. 

Proveremo perciò un’altra via per 
uscire dalla nostra situazione spiacevo¬ 
le, cercando una soluzione che lasci 
essenzialmente intatto il concetto clas¬ 
sico di verità. L’applicabilità del con¬ 
cetto di verità dovrà subire alcune re¬ 
strizioni, ma il concetto rimarrà dispo¬ 
nibile almeno per gli scopi di un di¬ 
scorso colto. 

A questo scopo dobbiamo analizza¬ 
re quei tratti caratteristici del linguag¬ 
gio comune che sono la fonte reale del- 
l’antinqmia del mentitore. Nel corso di 
questa analisi colpisce subito un aspet¬ 
to notevole del linguaggio in questione: 
il suo carattere universale, onnicom¬ 


prensivo. Il linguaggio comune è uni¬ 
versale, né deve essere altrimenti, giac¬ 
ché ci si aspetta che esso fornisca i 
mezzi adeguati a esprimere ogni cosa 
che possa essere espressa, in un qual¬ 
sivoglia linguaggio; esso si arricchisce 
di continuo per soddisfare tale requi¬ 
sito. In particolare il linguaggio comu¬ 
ne è semanticamente universale nel sen¬ 
so seguente: accanto agli oggetti lin¬ 
guistici, come proposizioni e termini, 
che sono componenti del linguaggio, 
in esso sono presenti anche i nomi di 
tali oggetti (come sappiamo, un nome 
di un’espressione si può ottenere ponen¬ 
do l’espressione fra virgolette); inol¬ 
tre, il linguaggio contiene termini se¬ 
mantici quali « verità », « nome », «de¬ 
signazione » che, direttamente o indi¬ 
rettamente, si riferiscono alla relazione 
fra gli oggetti linguistici e ciò che essi 
esprimono. Di conseguenza, per ogni 
proposizione formulata nel linguaggio 
comune, possiamo formarne nello stes¬ 
so linguaggio un’altra la quale esprima 
che la prima proposizione è vera o 
falsa. Con un ulteriore espediente, pos¬ 
siamo perfino costruire nel linguaggio 
ciò che talvolta vien detta una propo¬ 
sizione autoioga, cioè una proposizione 
S che esprime il fatto che S stessa è 
vera o che è falsa. Se S esprime la pro¬ 
pria falsità, si può dimostrare con un 
semplice ragionamento che S è con¬ 
temporaneamente vera e falsa, e cosi 
ci ritroviamo di fronte l’antinomia del 
mentitore. 

Si noti, tuttavia, che non in tutte le 
situazioni è necessario l’uso dei lin¬ 
guaggi universali. In particolare, tali 
linguaggi non sono generalmente ne¬ 
cessari per gli scopi della scienza (e per 
scienza intendo qui l’intero campo del¬ 
l’investigazione intellettuale). In rami 
particolari della scienza, diciamo nella 
chimica, si studiano certi oggetti par¬ 
ticolari, come gli elementi, le molecole 
eccetera, ma non per esempio oggetti 
linguistici come proposizioni o termini. 
Il linguaggio che ben si adatta a tale 
trattazione è perciò un linguaggio ri¬ 
stretto con un vocabolario limitato: es¬ 
so deve contenere nomi per gli oggetti 
chimici, termini come « elemento » e 
« molecola », ma non nomi per ogget¬ 
ti linguistici; non è perciò necessario 
che sia semanticamente universale. Un 
discorso analogo vale per la maggior 
parte degli altri rami della scienza. La 
situazione si fa un po’ confusa, però, 
se passiamo a considerare la linguisti¬ 
ca, ossia la scienza in cui si studiano i 
linguaggi: il linguaggio della linguistica 
deve certamente essere fornito di nomi 
per gli oggetti linguistici. Tuttavia non 
è necessario identificare il linguaggio 
della linguistica col linguaggio univer¬ 
sale, né con alcuno dei linguaggi che 


sono oggetto di indagine linguistica, e 
non siamo tenuti a supporre che in lin¬ 
guistica si usi uno stesso linguaggio per 
tutte le indagini. Il linguaggio della lin¬ 
guistica deve contenere nomi per le 
componenti linguistiche dei linguaggi 
studiati, ma non i nomi delle sue pro¬ 
prie componenti; cosi di nuovo, non è 
necessario che sia semanticamente uni¬ 
versale. Lo stesso può dirsi per il lin¬ 
guaggio della logica, o meglio di quella 
parte della logica nota come metalogica 
e metamatematica; anche qui abbiamo 
a che fare con linguaggi e in primo 
luogo con i linguaggi delle teorie logi¬ 
che e matematiche (sebbene qui si stu¬ 
dino tali linguaggi da un punto di vi¬ 
sta diverso da quello della linguistica). 

Ci si può chiedere ora se possa de¬ 
finirsi in modo preciso un concetto di 
verità e quindi se possa stabilirsi un 
uso coerente e adeguato di questo con¬ 
cetto, almeno per i linguaggi semanti¬ 
camente limitati del discorso scientifi¬ 
co. Sotto certe condizioni la risposta a 
tale domanda risulta affermativa. Le 
principali condizioni imposte al lin¬ 
guaggio sono che il suo vocabolario 
sia completamente ed esplicitamente 
determinato e che siano formulate con 
precisione le regole sintattiche che ri¬ 
guardano la formazione delle proposi¬ 
zioni e delle altre espressioni sensate 
a partire dalle parole elencate nel voca¬ 
bolario. Inoltre le regole sintattiche 
debbono essere puramente formali, cioè 
debbono riferirsi esclusivamente alla 
forma (forma esteriore) delle espressio¬ 
ni; la funzione e il significato di una 
espressione debbono dipendere esclusi¬ 
vamente dalla sua forma. In particola¬ 
re, osservando un’espressione si deve 
essere in grado in ciascun caso di deci¬ 
dere se è una proposizione o no; non 
deve mai capitare che un’espressione 
assolva da qualche parte la funzione 
di proposizione mentre un’espressione 
della stessa forma non si comporti co¬ 
si da qualche altra parte, oppure che 
una proposizione possa essere asserita 
in un certo contesto mentre una pro¬ 
posizione della stessa forma possa es¬ 
sere negata in un altro. Ne segue, in 
particolare, che pronomi e avverbi di¬ 
mostrativi quali « questo » e « qui » 
non dovranno comparire nel vocabo¬ 
lario del linguaggio; i linguaggi che 
soddisfano a queste condizioni verranno 
detti linguaggi formalizzati. Quando si 
studia un linguaggio formalizzato non 
è necessario distinguere fra espressioni 
della stessa forma che sono state scrit¬ 
te o pronunciate in luoghi diversi; spes¬ 
so se ne parla come di una stessa e- 
spressione. Il lettore può aver notato 
che talvolta si usa questo modo di par¬ 
lare anche nel trattare un linguaggio 
naturale, cioè che non sia formalizzato; 
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si fa cosi per semplicità e solo in quei 
casi in cui non sembra esserci pericolo 
di confusione. 

I linguaggi formalizzati sono del tut¬ 
to adeguati per la presentazione di teo¬ 
rie logiche e matematiche; non vedo 
alcuna ragione essenziale perché non 
possano venire adattati si da poter es¬ 
sere impiegati in altre discipline scien¬ 
tifiche, e in particolare nello sviluppo 
delle parti teoriche delle scienze empi¬ 
riche. Vorrei sottolineare che nell’usa- 
re il termine « linguaggi formalizzati » 
non mi riferisco esclusivamente a quei 
sistemi linguistici che sono formulati 
completamente in simboli, né penso a 
qualcosa di essenzialmente opposto ai 
linguaggi naturali. Al contrario, gli uni¬ 
ci linguaggi formalizzati che sembra¬ 
no essere di un qualche interesse reale 
sono quelli che sono frammenti dei lin¬ 
guaggi naturali (frammenti provvisti di 
un vocabolario completo e di precise 
regole sintattiche) o quelli che alme¬ 
no possano essere adeguatamente tra¬ 
dotti nei linguaggi naturali. 

Ci sono alcune condizioni ulteriori 
dalle quali dipende la realizzazione del 
nostro programma. Si dovrebbe fare 
una rigida distinzione fra il linguaggio 
che è l’oggetto del nostro studio e per 
il quale in particolare si vuole costrui¬ 
re la definizione di verità e il linguag¬ 
gio nel quale la definizione deve esse¬ 
re formulata e le sue implicazioni stu¬ 
diate. Quest’ultimo verrà detto meta- 
linguaggio e il primo linguaggio ogget¬ 
to. Il metalinguaggio deve essere suf¬ 
ficientemente ricco; in particolare deve 
contenere come parte il linguaggio og¬ 
getto. Infatti secondo le nostre conven¬ 
zioni una definizione adeguata di veri¬ 
tà implicherà come conseguenze tutte 
le definizioni parziali di tale concet¬ 
to, cioè tutte le equivalenze della for¬ 
ma (3): 

« p » è vera se e solo se p, 

dove « p » va sostituita in ambo i mem¬ 
bri dell’equivalenza con una proposi¬ 
zione arbitraria del linguaggio oggetto. 
Giacché tutte queste conseguenze sono 
formulate nel metalinguaggio, se ne 
conclude che ogni proposizione del lin¬ 
guaggio oggetto dev’essere anche una 
proposizione del metalinguaggio. Inol¬ 
tre, il metalinguaggio deve contenere 
nomi per proposizioni (e altre espres¬ 
sioni) del linguaggio oggetto, giacché 
questi nomi compaiono nel primo 
membro delle equivalenze del tipo (3). 
Esso deve anche contenere alcuni altri 
termini che occorrono per lo studio del 
linguaggio oggetto, e precisamente ter¬ 
mini che denotino certi particolari in¬ 
siemi di espressioni, relazioni fra espres¬ 
sioni e operazioni sulle espressioni; per 


esempio, deve esserci la possibilità di 
parlare dell’insieme di tutte le propo¬ 
sizioni o dell’operazione di giustappo¬ 
sizione, mediante la quale da due e- 
spressioni se ne forma una nuova po¬ 
nendo una delle due immediatamente 
di seguito all’altra. Infine, nel definire 
la verità, si vede che i termini seman¬ 
tici (quelli che esprimono le relazioni 
tra le proposizioni del linguaggio og¬ 
getto e gli oggetti a cui tali proposi¬ 
zioni si riferiscono) possono essere in¬ 
trodotti nel metalinguaggio mediante 
definizioni. Se ne conclude che un me¬ 
talinguaggio che fornisca mezzi suffi¬ 
cienti a definire la verità deve essere 
essenzialmente più ricco del linguaggio 
oggetto; esso non può coincidere né 
essere traducibile in quest’ultimo, giac¬ 
ché altrimenti ambedue risulterebbero 
semanticamente universali, e l’antino¬ 
mia del mentitore sarebbe ricostruibile 
in entrambi. Ritorneremo su questa 
questione nell’ultimo paragrafo del pre¬ 
sente articolo. 

Se tutte le precedenti condizioni so¬ 
no soddisfatte, la costruzione della de¬ 
siderata definizione di verità non pre¬ 
senta difficoltà essenziali. Tecnicamen¬ 
te, tuttavia, essa è troppo complicata 
per essere esposta qui in dettaglio. Per 
ogni data proposizione del linguaggio 
oggetto si può facilmente formulare la 
corrispondente definizione parziale del¬ 
la forma (3). Tuttavia, giacché l’insie¬ 
me di tutte le proposizioni del linguag¬ 
gio oggetto è di regola infinito, mentre 
ogni proposizione del metalinguaggio è 
una successione finita di segni, non si 
può arrivare a una definizione gene¬ 
rale formando semplicemente la con¬ 
giunzione logica di tutte le definizioni 
parziali. Nondimeno, ciò che alla fine 
si ottiene è, in un senso intuitivo, equi¬ 
valente alla immaginaria congiunzione 
infinita. Molto approssimativamente, si 
procede come segue. Dapprima si con¬ 
siderano le proposizioni più semplici, 
che non contengono altre proposizioni 
come parti; per queste proposizioni si 
trova il modo di definire la verità di¬ 
rettamente (usando la stessa idea che 
conduce alle definizioni parziali). Poi, 
mediante l’uso delle regole sintattiche 
che riguardano la formazione di propo¬ 
sizioni più complicate a partire da quel¬ 
le più semplici, si estende la definizione 
a proposizioni composte arbitrarie; si 
applica qui il metodo conosciuto in 
matematica come definizione per ricur- 
sione. (Questa è, a dire il vero, una 
grossolana approssimazione del proce¬ 
dimento. Per ragioni tecniche il meto¬ 
do di ricursione si applica, in realtà, 
non per definire il concetto di verità, 
ma quello a esso collegato di soddi¬ 
sfazione; la verità viene poi facilmente 
definita in termini di soddisfazione.) 


Sulla base della definizione cosi co¬ 
struita si può sviluppare l’intera teoria 
della verità. In particolare si possono 
derivare da essa, oltre a tutte le equi¬ 
valenze della forma (3), alcune conse¬ 
guenze di carattere generale, quali il 
famoso principio di non contraddizione 
e quello del terzo escluso. Per il primo 
dì questi due principi, non possono 
essere entrambe vere due proposizioni 
una delle quali sia la negazione dell’al¬ 
tra; per il secondo principio, due pro¬ 
posizioni siffatte non possono essere 
ambedue false. 

Il concetto di dimostrazione 

Qualunque cosa possa ottenersi dal¬ 
la costruzione di una definizione ade¬ 
guata del concetto di verità per un lin¬ 
guaggio scientifico, una cosa è certa; 
la definizione non porta con sé un cri¬ 
terio pratico per decidere se una par¬ 
ticolare proposizione di tale linguaggio 
sia vera o falsa (e invero questo non è 
affatto il suo scopo). Si consideri per 
esempio la seguente proposizione nel 
linguaggio della geometria elementare; 
« le tre bisettrici di un triangolo passa¬ 
no per uno stesso punto ». Se ci inte¬ 
ressa sapere se questa proposizione è 
vera e ci rifacciamo alla definizione di 
verità per scoprirlo, siamo destinati ad 
avere una delusione. L’unica informa¬ 
zione che ricaviamo è che la proposi¬ 
zione è vera se le tre bisettrici di un 
triangolo si incontrano sempre in un 
punto, e falsa in caso contrario; solo 
un’indagine di natura geometrica ci 
permetterà di decidere come stanno le 
cose in realtà. Considerazioni analoghe 
valgono per proposizioni tratte dal do¬ 
minio di altre scienze particolari: è 
compito della scienza stessa scoprire se 
una tale proposizione è vera o falsa, 
e non della logica o della teoria della 
verità. 

Alcuni filosofi ed epistemologi sono 
propensi a rifiutare ogni definizione che 
non fornisca un criterio per decidere, 
per ciascun oggetto particolare asse¬ 
gnato, se cada o no sotto il concetto 
definito. Nella metodologia delle scien¬ 
ze empiriche tale tendenza è rappre¬ 
sentata daU’operazionismo e è condi¬ 
visa anche da quei filosofi della mate¬ 
matica che appartengono alla scuola 
costruttivista; in ambedue i.casi, tutta¬ 
via, solo una piccola minoranza dei 
pensatori sono di questa opinione. Non 
è mai stato fatto un tentativo organico 
per condurre a termine, in pratica, il 
programma di sviluppare una scienza 
senza l’uso di definizioni indesiderabi¬ 
li. È chiaro che seguendo un program¬ 
ma del genere molta della matemati¬ 
ca contemporanea scomparirebbe e re¬ 
sterebbero gravemente mutilati anche 
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gli aspetti teorici della fìsica, della chi¬ 
mica, della biologia e delle altre scien¬ 
ze empiriche. Nella definizione di con¬ 
cetti come atomo, gene, eccetera, cosi 
come nella maggior parte delle defini¬ 
zioni matematiche, non è implicito al¬ 
cun criterio per decidere se un og¬ 
getto cade o no sotto il termine defi¬ 
nito. 

Proprio per la mancanza di un tale 
criterio di decisione nella definizione di 
verità, mentre la ricerca della verità è 
giustamente considerata l’essenza delle 
attività scientifiche, diventa un proble¬ 
ma importante trovare almeno dei cri¬ 
teri parziali di verità e sviluppare pro¬ 
cedimenti che ci permettano di asse¬ 
rire o negare la verità (o per lo meno 
la probabilità della verità) del maggior 
numero possibile di proposizioni. E, 
in realtà, esistono procedimenti di que¬ 
sto tipo, alcuni usati esclusivamente 
nelle scienze empiriche, altri prevalen¬ 
temente nelle scienze deduttive. Il con¬ 
cetto di dimostrazione - il secondo 
preso in considerazione nel presente la¬ 
voro - si riferisce appunto a un pro¬ 
cedimento per verificare la verità delle 
proposizioni, che viene impiegato pre¬ 
valentemente nelle scienze deduttive; 
esso è un elemento essenziale di ciò 
che è noto come metodo assiomatico, il 
solo metodo ormai usato per sviluppa¬ 
re le discipline matematiche. 

Il metodo assiomatico e, all’interno 
di esso, il concetto di dimostrazione, 
sono frutto di un lungo sviluppo sto¬ 
rico; per capire l’odierno concetto di 
dimostrazione è foise essenziale una 
conoscenza, sia pure rudimentale, di 
tale sviluppo. 

In origine, una disciplina matematica 
era considerata come un aggregato di 
proposizioni, relative a una certa clas¬ 
se di oggetti o fenomeni, che venivano 
formulate a partire da certi termini ini¬ 
ziali e che erano considerate vere. Tale 
aggregato di proposizioni non aveva al¬ 
cuna struttura interna; una proposizio¬ 
ne veniva accettata come vera o per¬ 
ché intuitivamente evidente o perché 
era dimostrata a partire da alcune pro¬ 
posizioni intuitivamente evidenti, ri¬ 
sultando quindi una conseguenza di 
queste ultime sulla base di un ragio¬ 
namento intuitivamente sicuro. Il crite¬ 
rio dell’evidenza intuitiva e dell’intuiti¬ 
va certezza dei ragionamenti veniva ap¬ 
plicato senza restrizioni; ogni proposi¬ 
zione riconosciuta per vera sulla base 
di tale criterio veniva automaticamen¬ 
te inclusa nella disciplina. La descri¬ 
zione testé fornita sembra adeguata, 
per esempio, alla scienza della geome¬ 
tria com’era nota agli antichi Egizi e 
ai Greci nel suo stadio preeuclideo. 

Presto ci si accorse, però, che il cri¬ 
terio dell’evidenza intuitiva è lungi dal¬ 


l’essere infallibile, non ha alcun carat¬ 
tere oggettivo e spesso conduce a seri 
errori. Tutto lo sviluppo successivo del 
metodo assiomatico può considerarsi 
come espressione della tendenza a li¬ 
mitare l’uso dell’evidenza intuitiva. 

Tale tendenza si rivelò la prima vol¬ 
ta nello sforzo di dimostrare il mag¬ 
gior numero possibile di proposizioni e 
quindi di limitare il più possibile il nu¬ 
mero delle proposizioni accettate per 
vere sulla sola base dell’evidenza. L’i¬ 
deale, da questo punto di vista, sareb¬ 
be quello di dimostrare ogni proposi¬ 
zione che vada accettata per vera, ma 
per ovvie ragioni un tale ideale non 
può essere raggiunto. Infatti, una pro¬ 
posizione si dimostra a partire da altre, 
queste a partire da altre ancora e co¬ 
si via: se vogliamo evitare sia un cir¬ 
colo vizioso sia un regresso all’infinito, 
siamo costretti a interrompere la tra¬ 
fila in qualche punto. Come compro¬ 
messo fra l’ideale irraggiungibile e le 
possibilità effettive, emersero due prin¬ 
cipi che furono successivamente usa¬ 
ti per costruire discipline matematiche. 
Per il primo di questi principi ogni 
teoria comincia con un piccolo elenco 
di proposizioni che appaiono intuitiva¬ 
mente evidenti e che sono accettate per 
vere senza ulteriori giustificazioni. Se¬ 
condo l’altro principio, nessun’altra 
proposizione viene accettata per vera 
nella disciplina se non si riesce a di¬ 
mostrarla col solo ausilio degli assio¬ 
mi e delle proposizioni dimostrate in 
precedenza. 

Tutte le proposizioni che si possono 
considerare vere grazie a questi due 
principi vengono chiamate teoremi o 
proposizioni dimostrabili della data teo¬ 
ria. Due principi analoghi regolano l’u¬ 
so e la costruzione dei termini della 
teoria; per il primo, si fa all’inizio un 
elenco di quei termini, intelligibili di¬ 
rettamente, che si usano nell’enunciato 
e nella dimostrazione dei teoremi, sen¬ 
za spiegarne il significato: essi vengo¬ 
no detti termini primitivi o termini non 
definiti; per il secondo principio si con¬ 
viene di non usare alcun altro termine 
il cui significato non possa spiegarsi 
mediante esplicita definizione a partire 
dai termini primitivi e da quelli definiti 
precedentemente. Questi quattro prin¬ 
cipi sono le pietre miliari del metodo 
assiomatico, e le teorie sviluppate in 
accordo con essi vengono chiamate teo¬ 
rie assiomatiche. 

È ben noto che il metodo assiomati¬ 
co fu applicato allo sviluppo della geo¬ 
metria verso il 300 a.C. negli Elementi 
di Euclide. Da allora esso fu usato 
per oltre 2000 anni praticamente sen¬ 
za alcun cambiamento dei suoi princi¬ 
pi fondamentali (i quali, per inciso, non 
furono nemmeno esplicitamente formu¬ 


lati per lungo tempo) né dell’atteggia¬ 
mento di fondo nell’affrontare l’argo¬ 
mento. Nel XIX e nel XX secolo, pe¬ 
rò, il metodo assiomatico subi una pro¬ 
fonda evoluzione, la quale, per quanto 
riguarda il concetto di dimostrazione, 
è particolarmente significativa per la 
nostra trattazione. 

Fin verso la fine del XIX secolo il 
concetto di dimostrazione rivesti un ca¬ 
rattere prevalentemente psicologico: 
una dimostrazione era un’attività in¬ 
tellettuale volta a convincere se stesso 
e gli altri della verità di una data pro¬ 
posizione; più precisamente, nello svi¬ 
luppare una teoria matematica, le di¬ 
mostrazioni venivano usate per convin¬ 
cere se stessi e gli altri che una data 
proposizione doveva essere accettata 
per vera una volta che fossero state 
prese per vere certe proposizioni pre¬ 
cedenti. Per i ragionamenti usati nel¬ 
le dimostrazioni non veniva posta al¬ 
cuna condizione, salvo quella di esse¬ 
re intuitivamente convincenti. A un 
certo momento, però, cominciò a farsi 
sentire il bisogno di sottoporre il con¬ 
cetto di dimostrazione a un’analisi più 
approfondita, con l’eventuale risultato 
di dover limitare il ricorso all’evidenza 
intuitiva, sia pur rimanendo nel vec¬ 
chio schema. La cosa fu dovuta, pro¬ 
babilmente, a certi particolari sviluppi 
della matematica, soprattutto alla sco¬ 
perta delle geometrie non euclidee. La 
analisi fu condotta dai logici, a parti¬ 
re dal logico tedesco Gottlob Frege; si 
giunse così a introdurre un nuovo con¬ 
cetto, quello di dimostrazione formale, 
che rappresentò un sostituto adeguato 
del vecchio concetto psicologico e an¬ 
che un essenziale miglioramento. 

Il primo passo per corredare una 
teoria matematica del concetto di di¬ 
mostrazione formale è la formalizza¬ 
zione del suo linguaggio, nel senso spie¬ 
gato sopra in relazione alla definizione 
di verità; si danno cosi delle regole sin¬ 
tattiche formali che permettano, in par¬ 
ticolare, di distinguere, a partire solo 
dalla forma esteriore delle espressioni, 
fra le espressioni stesse quelle che sono 
proposizioni. Il passo successivo con¬ 
siste nel formulare alcune regole di 
natura diversa, le cosiddette regole di 
deduzione o di inferenza. In virtù di 
queste regole una proposizione viene 
considerata direttamente deducibile da 
certe proposizioni date se, in generale, 
la sua forma è collegata alla forma 
delle altre in una maniera assegnata. Il 
numero delle regole di inferenza è pic¬ 
colo, e il loro contenuto semplice; pro¬ 
prio come per il caso delle regole sin¬ 
tattiche, esse hanno un carattere for¬ 
male, cioè si riferiscono esclusivamen¬ 
te alla forma esteriore delle proposi¬ 
zioni a cui si applicano. Intuitivamente. 
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tutte le regole di deduzione sono chia¬ 
ramente infallibili, nel senso che risul¬ 
ta necessariamente vera ogni proposi¬ 
zione che sia direttamente derivabile, 
in virtù di una di tali regole, da propo¬ 
sizioni vere; l’infallibilità delle regole 
di deduzione può essere stabilita, in 
pratica, sulla base di una definizione 
adeguata di verità. Il più noto e im¬ 
portante esempio di regola di inferen¬ 
za è la regola di separazione, nota an¬ 
che come modus ponens. In virtù di 
questa regola (che in alcune teorie è 
l’unica regola di inferenza) una propo¬ 
sizione « q » è derivabile direttamente 
da due date proposizioni se una di es¬ 
se è la proposizione condizionale « se 
p, allora q », mentre l’altra è « p »; 
qui « p » e « q » sono, come al solito, 
abbreviazioni di due qualsivogliano 
proposizioni del nostro linguaggio for¬ 
malizzato. Siamo ora in grado di spie¬ 
gare in cosa consiste una dimostrazio¬ 
ne formale di una data proposizione. 
In un primo momento si applicano le 
regole di inferenza agli assiomi e si 
ottengono nuove proposizioni che so¬ 
no derivabili direttamente dagli assiomi, 
poi si applicano le solite regole al nuo¬ 
vo insieme di proposizioni cosi ottenu¬ 
to e si ottengono ancora altre proposi¬ 
zioni, e cosi via. Di una proposizione 
che sia stata ottenuta per questa via do¬ 
po un numero finito di passi si dice che 
è stata dimostrata formalmente. Quan¬ 
to precede si può esprimere in modo 
più preciso come segue: una dimostra¬ 
zione formale di una data proposizio¬ 
ne consiste nel costruire una successio¬ 
ne finita di proposizioni tale che (1) la 
prima proposizione della successione è 
un assioma, (2) ciascuna delle propo¬ 
sizioni seguenti è un assioma oppure è 
derivabile direttamente, mediante una 
regola di inferenza, da alcune delle 
proposizioni che la precedono nella 
successione, e (3) l’ultima proposizione 
della successione è quella che si voleva 
dimostrare. Forzando un po’ l’uso del¬ 
la parola « dimostrazione », si può di¬ 
re addirittura che una dimostrazione 
formale è proprio una successione fi¬ 
nita di proposizioni con le proprietà 
sopra elencate. 

Si chiama teoria formale una teoria 
assiomatica il cui linguaggio sia stato 
formalizzato, e per la quale si sia da¬ 
ta una definizione di dimostrazione for¬ 
male. Conveniamo di accettare come 
uniche dimostrazioni in una teoria for¬ 
male le sue dimostrazioni forma’i; quin¬ 
di le uniche proposizioni accettabili co¬ 
me teoremi saranno quelle che compa¬ 
iono nell’elenco degli assiomi e quelle 
per cui possa trovarsi una dimostrazio¬ 
ne formale. Il metodo che consiste nel 
presentare una teoria formalizzata in 
ognuna delle fasi del suo sviluppo è, in 


linea di principio, molto elementare. 
Prima si elencano gli assiomi, poi tutti i 
teoremi noti, in un ordine tale che cia¬ 
scuna proposizione dell’elenco che non 
sia un assioma possa venire riconosciu¬ 
ta direttamente come teorema sempli¬ 
cemente confrontando la sua forma 
con quella delle proposizioni che la 
precedono nell’elenco; viene cosi esclu¬ 
so ogni ricorso a complicate vie di 
ragionare e di convincere. (Natural¬ 
mente non mi riferisco qui ai proces¬ 
si psicologici mediante i quali i teo¬ 
remi sono stati scoperti nella realtà.) Il 
ricorso all’evidenza intuitiva viene cosi 
a essere notevolmente limitato; non 
che si siano completamente eliminati i 
dubbi relativi alla verità dei teoremi, 
ma ci siamo almeno ridotti solo agli 
eventuali dubbi sulla verità delle poche 
proposizioni elencate come assiomi e 
sulla infallibilità delle poche e sem¬ 
plici regole di deduzione. Anche per 
quanto riguarda l’introduzione di nuo¬ 
vi termini nel linguaggio, si potrebbe 
usare un metodo formale, fornendo 
certe regole formali per le definizioni. 

È ormai noto che tutte le teorie ma¬ 
tematiche esistenti possono venire pre¬ 
sentate come teorie formali, e che si 
possono trovare delle dimostrazioni for¬ 
mali per quei teoremi matematici, per 
profondi e complicati che siano, che in 
origine furono stabiliti con ragiona¬ 
menti intuitivi. 

Le relazioni fra verità e dimostrazione 

È stato senza dubbio un grande pro¬ 
gresso della logica moderna l’aver sosti¬ 
tuito al vecchio concetto psicologico di 
dimostrazione, che non poteva certo es¬ 
sere reso, chiaro e rigoroso, un nuovo 
concetto'che avesse sia la dote della 
semplicità sia un carattere puramen¬ 
te formale. Tuttavia nel trionfo del 
metodo formale era già insito il ger¬ 
me di un futuro regresso: come ora ve¬ 
dremo, proprio la semplicità del nuovo 
concetto era il suo tallone di Achille. 

Per dare un giudizio di valore sul 
concetto di dimostrazione formale, dob¬ 
biamo chiarirne i rapporti col concetto 
di verità. In fondo, la dimostrazione 
formale, come del resto la vecchia di¬ 
mostrazione intuitiva, è un procedi- 
rpento che mira ad acquisire nuove 
proposizioni vere. Un tale procedimen¬ 
to si considererà perciò adeguato solo 
se tutte le proposizioni che possono ac¬ 
quisirsi con il suo ausilio risulteranno 
vere e, viceversa, tutte le proposizioni 
vére saranno ottenibili per suo mezzo. 
Ne sorge, in modo spontaneo, il pro¬ 
blema se la dimostrazione formale sia 
in effetti un procedimento adeguato per 
acquisire la verità; in altre parole, se 
l’insieme delle proposizioni dimostrabi¬ 


li (formalmente) coincida con l’insie¬ 
me delle proposizioni vere. 

Studieremo questo problema, per 
semplicità, relativamente a una partico¬ 
lare teoria matematica molto elemen¬ 
tare, cioè aH’aritmetica dei numeri na¬ 
turali (teoria elementare dei numeri). 
Supponiamo che la teoria in questione 
venga presentata come teoria formale. 
Il suo vocabolario è molto povero e 
consta di variabili, quali « m », « n », 

« p »,... che rappresentano numeri na¬ 
turali; dei numerali « 0 », « 1 », « 2 »,... 
che denotano numeri particolari; di sim¬ 
boli che denotano alcune relazioni e 
operazioni familiari sui numeri, quali 
« — », « < », « T », « — » ; e infine di 
certi termini logici, e precisamente i 
connettivi proposizionali («e », « oppu¬ 
re », « se... allora », « non ») e i quanti¬ 
ficatori (espressioni della forma « per 
ogni numero m » e « per qualche nu¬ 
mero m »). Le regole sintattiche e le 
regole di inferenza sono semplici. Nel 
seguito, parlando di proposizioni, ci ri¬ 
feriremo costantemente alle proposizio¬ 
ni del linguaggio formalizzato dell’arit- 
metica. 

Da quanto esposto nel primo para¬ 
grafo sulla verità, risulta che si può 
prendere il linguaggio formalizzato dal¬ 
l’aritmetica come linguaggio oggetto e 
costruire un opportuno metalinguag¬ 
gio nel quale si possa formulare una 
definizione adeguata di verità. Risulta 
comodo, in tale contesto, dire che si 
è cosi definito l’insieme delle proposi¬ 
zioni vere; la definizione di verità espri¬ 
me infatti che una certa condizione 
formulata nel metalinguaggio è soddi¬ 
sfatta da tutti e soli gli elementi di que¬ 
sto insieme, cioè da tutte e sole le 
proposizioni vere. Ancor più facilmente 
si può definire, nel metalinguaggio, l’in¬ 
sieme delle proposizioni dimostrabili, 
attenendosi alla spiegazione del concet¬ 
to di dimostrazione formale data nel 
secondo paragrafo. A rigore, sia la 
definizione di verità sia quella di dimo¬ 
strabilità appartengono a una nuova 
teoria formulata nel metalinguaggio e 
costruita col preciso scopo di studiare 
l’aritmetica formalizzata e il suo lin¬ 
guaggio. La nuova teoria è chiamata 
metateoria o, nel caso in esame, me¬ 
taaritmetica. Non approfondiremo qui 
il modo in cui la metateoria, con i suoi 
assiomi, termini primitivi eccetera, vie¬ 
ne costruita; ci limiteremo a far nota¬ 
re che essa rappresenta il quadro nel 
quale si formula e si risolve il proble¬ 
ma del confronto fra l’insieme delle 
proposizioni dimostrabili e quello delle 
proposizioni vere. 

La soluzione del problema risulta ne¬ 
gativa, e qui daremo una rapida de¬ 
scrizione del metodo che ha permesso 
di dimostrarlo. L’idea principale è stret- 
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tamente connessa con quella usata dal 
logico contemporaneo americano (di 
origine austriaca) Kurt Godei nella sua 
famosa pubblicazione sulla incomple¬ 
tezza dell’aritmetica. 

Nel primo paragrafo abbiamo osser¬ 
vato che il metalinguaggio che ci per¬ 
mette di definire e studiare il concet¬ 
to di verità deve essere ricco. Esso con¬ 
tiene tutto il linguaggio oggetto come 
sua parte e quindi si può parlare in 
esso dei numeri naturali, delle relazio¬ 
ni fra numeri naturali e cosi via. Esso 
contiene inoltre dei termini necessari 
per lo studio del linguaggio oggetto e 
delle sue componenti; di conseguenza 
si può parlare, nel metalinguaggio, del¬ 
le espressioni, e in particolare delle pro¬ 
posizioni e cosi via. Nella metateoria 
si ha dunque la possibilità di studiare 
le proprietà di tali oggetti e stabilirne 
i mutui rapporti. 

Facendo ricorso alla descrizione del¬ 
le proposizioni fornita dalle regole sin¬ 
tattiche del linguaggio oggetto è faci¬ 
le, in particolare, disporre tutte le pro¬ 
posizioni in successione in ordine pro¬ 
gressivo di complessità e numerarle 
successivamente. Si viene ad associare, 
cosi, un numero naturale a ciascuna 
proposizione, in modo tale che a pro¬ 
posizioni diverse vengano sempre asso¬ 
ciati numeri diversi; in altre parole, si 
stabilisce una corrispondenza biunivoca 
fra le proposizioni e i numeri. Questa a 
sua volta induce una corrispondenza 
biunivoca fra gli insiemi di proposizio¬ 
ni e gli insiemi di numeri, come pure 
fra le relazioni fra proposizioni e le re¬ 
lazioni fra numeri. In particolare, ci 
saranno dei numeri associati a propo¬ 
sizioni dimostrabili e altri associati a 
proposizioni vere; per brevità li chia¬ 
meremo rispettivamente numeri dimo¬ 
strabili* e numeri veri*. Il problema 
che ci interessa si riduce quindi al con¬ 
fronto fra l’insieme dei numeri dimo¬ 
strabili* e quello dei numeri veri*. 

Per mostrare che i due insiemi non 
coincidono, sarà ovviamente sufficien¬ 
te indicare una proprietà di cui goda 
uno dei due insiemi e non l’altro. La 
proprietà che indicheremo noi potrà 
sembrare sorprendente, quasi un deus 
ex machina. 

La semplicità intrinseca dei concet¬ 
ti di dimostrazione formale e di dimo¬ 
strabilità formale rivestirà qui un ruo¬ 
lo fondamentale. Si è visto nel secon¬ 
do paragrafo che il significato di que¬ 
sti concetti viene spiegato essenzial¬ 
mente in termini di certe relazioni sem¬ 
plici fra proposizioni assegnate da po¬ 
che regole di inferenza, come per esem¬ 
pio la regola del modus ponens. Le cor¬ 
rispondenti relazioni fra i numeri del¬ 
le proposizioni sono altrettanto sem¬ 
plici; esse possono essere descritte me¬ 


diante le operazioni e relazioni arit¬ 
metiche più semplici, quali l’addizione, 
la moltiplicazione e l’uguaglianza, cioè 
mediante termini che compaiono espli¬ 
citamente nella teoria aritmetica. Di 
conseguenza, anche l’insieme dei nume¬ 
ri dimostrabili* può essere descritto 
mediante tali termini. Si può riassu¬ 
mere quanto precede dicendo che la 
definizione di dimostrabilità è stata tra¬ 
dotta dal metalinguaggio nel linguaggio 
oggetto. 

D’altro lato, l’esposizione che abbia¬ 
mo fatto relativamente al concetto di 
verità nei linguaggi correnti suggerisce 
la congettura che un’analoga traduzio¬ 
ne non sia possibile per la definizione 
di verità, altrimenti il linguaggio ogget¬ 
to risulterebbe in un certo senso se¬ 
manticamente universale col risultato 
che potrebbe ricomparire l’antinomia 
del mentitore. Convalideremo tale con¬ 
gettura mostrando che effettivamente 
sarebbe possibile riformulare in questo 
linguaggio l’antinomia del mentitore 
qualora l’insieme dei numeri veri* fos¬ 
se definibile nel linguaggio deH’aritme- 
tica. Tuttavia, avendo ora a che fare 
con un linguaggio formalizzato limita¬ 
to, l’antinomia assumerebbe qui una 
forma più involuta e complicata; in 
particolare, nella nuova formulazione 
non comparirebbe alcuna espressione 
il cui significato empirico fosse del ti¬ 
po « la proposizione stampata nel pun¬ 
to tal dei tali », mentre nella formula¬ 
zione iniziale dell’antinomia è stata pro¬ 
prio un’espressione di questo tipo a ri¬ 
vestire un ruolo fondamentale. In que¬ 
sto articolo non ci addentreremo però 
ulteriormente nei dettagli tecnici della 
questione. 

In conclusione, l’insieme dei numeri 
dimostrabili* non coincide con quello 
dei numeri veri*, giacché mentre l’uno 
è definibile nel linguaggio dell’aritme¬ 
tica, l’altro non lo è. Ne segue che so¬ 
no distinti anche gli insiemi delle pro¬ 
posizioni dimostrabili e vere. Ricorren¬ 
do alla definizione di verità, si verifica 
d’altronde che tutti gli assiomi dell’arit- 
metica sono veri e tutte le regole di in¬ 
ferenza sono infallibili, quindi tutte le 
proposizioni dimostrabili sono vere e 
perciò non vale il viceversa. Abbiamo 
cosi raggiunto la conclusione che: esi¬ 
stono delle proposizioni vere formula¬ 
te nel linguaggio deH’aritmetica le qua¬ 
li non possono essere dimostrate a par¬ 
tire dagli assiomi e dalle regole di in¬ 
ferenza accettate in aritmetica. 

Si potrebbe pensare che la conclusio¬ 
ne precedente dipenda in modo essen¬ 
ziale dalla scelta degli assiomi e delle 
regole di inferenza particolari scelte per 
la nostra teoria aritmetica : arricchen¬ 
do opportunamente la teoria con rag¬ 
giunta di nuovi assiomi e nuove regole 


di inferenza, si potrebbe forse giungere 
a un risultato diverso. Una più attenta 
analisi mostra, invece, che il preceden¬ 
te ragionamento dipende ben poco dal¬ 
le proprietà specifiche della teoria esa¬ 
minata, essendo possibile estenderlo al¬ 
la maggior parte delle altre teorie for¬ 
mali. Supposto che in una teoria sia 
contenuta l’aritmetica dei numeri natu¬ 
rali, o almeno che questa si possa rico¬ 
struire all’interno di quella, allora è 
possibile ripetere la parte essenziale del 
precedente ragionamento in una forma 
praticamente immutata, giungendo co¬ 
si ancora alla conclusione che l’insie¬ 
me delle proposizioni dimostrabili è di¬ 
verso da quello delle proposizioni vere. 
Se inoltre (e questo è il caso più fre¬ 
quente) tutti gli assiomi della teoria so¬ 
no veri e tutte le regole di inferenza in¬ 
fallibili, si conclude ancora che esisto¬ 
no nella teoria delle proposizioni vere 
che non sono dimostrabili. Se si esclu¬ 
dono alcune teorie parziali con limitati 
mezzi espressivi, in genere l’ipotesi pre¬ 
cedente sulle relazioni fra una teoria e 
l’aritmetica è soddisfatta, perciò la no¬ 
stra conclusione ha un carattere quasi 
universale. Per quanto riguarda quel¬ 
le teorie povere che non comprendono 
l’aritmetica dei numeri naturali, può ac¬ 
cadere che il relativo linguaggio non 
abbia mezzi di espressione sufficienti a 
definire il concetto di dimostrabilità, e 
talvolta le proposizioni dimostrabili 
coincidano proprio con quelle vere. I 
più noti esempi, e forse i più impor¬ 
tanti, di teorie per le quali i due con¬ 
cetti coincidono sono la geometria ele¬ 
mentare e l’algebra elementare dei nu¬ 
meri reali. 

La parte predominante sostenuta in 
tutto il ragionamento dall’antinomia del 
mentitore chiarisce in modo interessan¬ 
te le precedenti osservazioni sul ruolo 
delle antinomie nella storia del pensie¬ 
ro umano. All’inizio l’antinomia del 
mentitore si è presentata nella nostra 
trattazione come una specie di forza 
del male con un enorme potare di di¬ 
struzione, costringendoci ad abbando¬ 
nare ogni tentativo di chiarire il con¬ 
cetto di verità per i linguaggi natura¬ 
li. Abbiamo dovuto limitare i nostri 
sforzi ai linguaggi formalizzati del di¬ 
scorso scientifico e, come salvaguardia 
contro la possibilità che l’antinomia ri¬ 
facesse la sua comparsa, abbiamo do¬ 
vuto complicare considerevolmente la 
indagine con la distinzione fra linguag¬ 
gio e metalinguaggio. 

In un secondo momento, però, nella 
nuova sistemazione, siamo riusciti a do¬ 
mare l’energia distruttiva incanalandola 
verso scopi pacifici e costruttivi; l’an¬ 
tinomia non si è riaffacciata, e l’idea di 
fondo in essa contenuta è stata anzi 
usata per stabilire un significativo ri- 
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sultato metalogico con notevoli e pro¬ 
fonde conseguenze. 

Il fatto che le implicazioni filosofiche 
del nostro risultato siano di carattere 
sostanzialmente negativo non ne dimi¬ 
nuisce affatto l’importanza. Il risultato 
mostra, invero, che in nessun campo 
della matematica il concetto di dimo¬ 
strabilità è un sostituto perfetto di quel¬ 
lo di verità; la credenza che la dimo¬ 
strazione formale possa costituire uno 
strumento adeguato per stabilire la ve¬ 
rità di tutti gli enunciati matematici si 
è rilevata infondata, e al trionfo inizia¬ 
le ha fatto seguito un regresso. 

Qualunque aggiunta si facesse ora 
alla precedente esposizione non potreb¬ 
be che diminuirne l’effetto. Il concetto 
di verità per le teorie formalizzate può 
ora introdursi in modo preciso median¬ 
te una definizione adeguata e può quin¬ 
di venire usato senza riserve né limi¬ 


tazioni nelle trattazioni metalogiche, 
giacché è addirittura diventato un con¬ 
cetto metalogico fondamentale che en¬ 
tra in problemi e risultati fra i più 
importanti. D’altra parte, neanche il 
concetto di dimostrazione ha perduto 
la sua importanza; la dimostrazione re¬ 
sta l’unico metodo usato per verificare 
la verità delle proposizioni nell’ambito 
di una teoria matematica particolare. 
Tuttavia, abbiamo ora acquisito la con¬ 
sapevolezza che esistono delle propo¬ 
sizioni, formulate nel linguaggio della 
teoria, vere ma non dimostrabili, e 
non possiamo trascurare l’eventualità 
che fra queste se ne trovi qualcuna di 
quelle interessanti che si desidererebbe 
dimostrare. In alcune situazioni può 
essere dunque desiderabile indagare 
sulla possibilità di ampliare l’insieme 
delle proposizioni dimostrabili; allo sco¬ 
po si arricchisce la data teoria aggiun¬ 


gendo nuove proposizioni al suo siste¬ 
ma di assiomi o dotandola di nuove 
regole di inferenza. In tale processo ser¬ 
ve da guida il concetto di verità, giac¬ 
ché vogliamo evitare di aggiungere as¬ 
siomi che si sospettino falsi o regole di 
inferenza che, applicate a proposizioni 
vere, diano luogo a proposizioni false. 
L’operazione di estendere una teoria 
può naturalmente essere ripetuta quan¬ 
te volte si vuole; ne risulta che il con¬ 
cetto di proposizione vera funziona co¬ 
me limite ideale che non potrà mai es¬ 
sere raggiunto ma che si tenta di ap¬ 
prossimare gradualmente mediante suc¬ 
cessivi ampliamenti dell’insieme delle 
proposizioni dimostrabili. Non c’è al¬ 
cun conflitto fra il concetto di verità 
e quello di dimostrazione nello svilup¬ 
po della matematica; i due concetti non 
sono in guerra fra loro, ma vivono in 
coesistenza pacifica. 
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Charles Lutwidge Dodgson nacque il 27 gennaio 1832 e mo¬ 
ri il 14 gennaio 1898. Il logico che sotto lo pseudonimo di 
Lewis Carroll scrisse Alice nel paese delle meraviglie , era an¬ 
che un appassionato fotografo dilettante specializzato in ritratti. 


Questo proviene dalla collezione Gernsheim dell’Humanities Re¬ 
search Center dell’Università del Texas di Austin. Lo sviluppo è 
stato ottenuto dal negativo originale della collezione Gernsheim. 
Il negativo porta il numero 2489, scritto a mano da Dodgson. 
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LE SCIENZE 


NUMERO 50 


Ottobre 1972 


Un libro di logica smarrito 
di Lewis Carroll 

Si sa che fautore di Alice scrisse anche un testo di logica simbolica. 
E stata recentemente scoperta una continuazione di questo libro che 
avvalora Eipotesi della profonda originalità della sua opera di logico 


« Sono cosi contenta che non mi 
piacciano gli asparagi - disse la Picco¬ 
la Ragazza a un Amico Simpatico. - 
Perché, se mi piacessero, dovrei man¬ 
giarli mentre non li posso sopportare! ». 

Q ueste parole dal suono familia¬ 
re furono scritte dal reverendo 
Charles Lutwidge Dodgson, in¬ 
caricato di matematica a Oxford e uni¬ 
versalmente noto come Lewis Carroll. 
Sarebbe vano tuttavia cercarle in qual¬ 
che lavoro di Dodgson già pubblicato. 
La Piccola Ragazza e il suo Amico 
Simpatico, come Achille e la Tartaru¬ 
ga, il Coccodrillo e il Mentitore, i Tre 
Barbieri, i Cinque Bugiardi e il Logi¬ 
co-giocatore d’azzardo divoratore di 
costolette di maiale, sono alcuni tra i 
molti personaggi, in parte già noti e in 
parte nuovi, che aguzzano il loro in¬ 
gegno - e il nostro - nel manoscritto 
e nelle bozze di stampa recentemente 
scoperte con cui Dodgson dava seguito 
alla sua Logica simbolica: Parte I, No¬ 
zioni elementari, pubblicata nel 1896. 
Dal titolo è chiaro che Dodgson aveva 
in programma la pubblicazione di nuo¬ 
vo materiale sull’argomento, ma il ma¬ 
noscritto al quale stava lavorando 
scomparve poco dopo la morte dell’au¬ 
tore, sopraggiunta nel gennaio 1898, 
all’età di 65 anni. Di esso non si trova 
cenno in nessuno dei minuziosi elenchi 
delle opere della « Carrolliana » pubbli¬ 
cati nell’ultimo mezzo secolo, e la 
maggior parte degli incartamenti fu 
bruciata poco dopo la sua morte. 

Fu nel 1959 che rintracciai, inizial¬ 
mente, una piccola parte dell’opera 
mancante in alcune carte superstiti di 
Dodgson rimaste alia Christ Church di 
Oxford. Il sospirato frammento era ac¬ 
curatamente composto a caratteri di 
stampa, sotto forma di bozze. Nei 10 
anni successivi sono andato alla ricer¬ 
ca di altre parti dell’opera nelle colle¬ 
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zioni, pubbliche e private, degli scritti 
di Lewis Carroll. Infine, nella vasta 
collezione dei manoscritti e delle lette¬ 
re di Dodgson raccolta da Morton N. 
Cohen, professore di inglese al Centro 
per laureati dell’Università di New 
York, ho rinvenuto alcune fotocopie di 
altre porzioni delle bozze. Cohen le 
aveva tratte dagli originali appartenen¬ 
ti alla biblioteca di John H. A. Spar- 
row, direttore dell’All Souls College di 
Oxford. Sparrow aveva ricevuto i fogli 
dal defunto A. S. L. Farquharson, che 
aveva curato la pubblicazione degli 
scritti postumi di John Cook Wilson. 
Quando era professore di logica a Ox¬ 
ford, Wilson, il 6 novembre 1896, ave¬ 
va ricevuto per posta le bozze da Dodg¬ 
son stesso, e si era evidentemente di¬ 
menticato di rispedirgliele. Cohen e 
Roger Lancelyn Green stanno ora cu¬ 
rando un’edizione definitiva delle let¬ 
tere di Dodgson. 11 materiale finora 
inedito che qui presentiamo è coperto 
da diritti d’autore riservati di Charles 
Lutwidge Dodgson. Attualmente sto al¬ 
lestendo una edizione critica dell’opera 
logica completa di Dodgson. 

^ccanto agli squarci di lettere e ma¬ 
noscritti rimasti finora in larga mi¬ 
sura indecifrabili, le pagine di mano¬ 
scritto e di bozze ora recuperate con¬ 
fermano il giudizio formulato su Dodg¬ 
son in via congetturale da alcuni stori¬ 
ci della matematica in base agli scarsi 
elementi forniti dal primo volume del¬ 
la Logica Simbolica e da diversi scrit¬ 
ti pubblicati sulla rivista « Mind ». 

Un decennio dopo la morte di Dodg¬ 
son la sua opera fu offuscata dalla ri¬ 
voluzione provocata nella logica dalla 
pubblicazione dei Principia Mathema¬ 
tica di Alfred North Whitehead e Ber¬ 
trand Russell. La seconda parte della 
Logica Simbolica dimostra che Dodg¬ 
son fu uno dei più interessanti innova¬ 


tori tecnici del periodo di transizione 
dalla logica tradizionale di scuola ari¬ 
stotelica alla nuova logica propugnata 
da Russell. Essa conferma anche che 
Dodgson era senza rivali nel proporre 
problemi, rompicapi e paradossi. Ciò è 
tanto più stupefacente se si considera 
che l’opera di rinnovamento in campi 
come quello della logica è compiuta 
abitualmente da giovani mentre Dodg¬ 
son ha prodotto la maggior parte del 
suo lavoro nell’ambito della logica a 
60 anni compiuti. Egli lavorava da so¬ 
lo; il solo logico con cui manteneva 
contatti regolari era Wilson, che peral¬ 
tro era ben poco stimolante. Wilson fu 
un accanito avversario della nuova lo¬ 
gica simbolica sviluppata da Dodgson 
e da altri. Più tardi Wilson disse che 
non riusciva a credere che Russell, la 
cui opera qualificava come « roba spre¬ 
gevole », potesse trovare un editore. 

La natura del trapasso dalla logica 
aristotelica alla logica matematica con¬ 
temporanea è talvolta fraintesa. Non 
manca chi pensa erroneamente che la 
logica aristotelica sia stata dimostrata 
« sbagliata » e che sia stata soppianta¬ 
ta dalla logica contemporanea nello 
stesso modo in cui una nuova ipotesi 
scientifica può soppiantarne una preesi¬ 
stente. La differenza tra la logica tra- 
diziqnale e la logica contemporanea è 
di natura differente. 

I logici cercano di formulare « re¬ 
gole del ragionamento valido » che ci 
assicureranno la possibilità di trarre 
solo conclusioni vere da premesse vere. 
Un ragionamento è valido quando e 
solo quando non si può produrre nes¬ 
sun controesempio. Un controesempio 
si produce se si può argomentare da 
un insieme di premesse vere a una con¬ 
clusione falsa seguendo le regole for¬ 
mulate. L’obiettivo è quello di evitare 
i ragionamenti non validi e le regole 
di inferenza che li rendono possibili. 
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Logic Parti C 10* 

BOOK XXI 

LOGICAI, PUZZLES. 

CHAFrER I. 
INTRODUCTORY. 


4 * m 
V*. 


Si consideri il ragionamento che se¬ 
gue, che nel quadro della logica aristo¬ 
telica viene trattato agevolmente con 
un sillogismo: 

Tutti gli uomini sono mortali 
Tutti i greci sono uomini 
Tutti i greci sono mortali. 

Il simbolo , naturalmente, sta per 
« perciò ». Questa è una inferenza va¬ 
lida, e la regola è: 

Tutti gli M sono X 
Tutti i G sono M 
Tutti i G sono X. 


Under this generai heading 1 shall discuss various arguments, which are variously 
described by Logicai writers. Some ha ve been classified as 1 Bop hi imi ’, that is, according 
to etymology, " cunning arguments ", whose characteristic Attributo seems to be that they 
are intended to confuse : others as ‘ Paradoxes that is, according to etymology, “ things 
contrary to expectation ", whose characteristic Attributo seems to be that they seem to prove 
what we know to be false : but all may be described by thè generai name “ Puzzles.” 


CHARTER 11. 
CLASSIGAL rUZZLES 


§ 1. 

Introductory. 

T shall here enuntiate five certain well-known Puzzles, which have come down to us 
from ancient times, and which thè Reader will no doubt like to know by their classical titlcs- 

§ 2 - 

Pseudomenos. 


This may al so ho described as “ Mentiens” , or “The Liar ". In its simplest forni it 
runs thus:- 

“ If a man says 1 1 am telling a lie ', and speaks truly, he it telling a lie, and therefore 
speaks falsely : but if he speaks falsely, he is not telling a lie, and therefore speaks truly ” 

§3. 

Crocodilus. 


That is, “ The Crocodile This tragica! story runs as follows :- 

“ A Crocodile had stole» a Baby off thè banks of thè Nilo. The Mothor implored him tc. 
restore her darling. 4 Well ’, said thè Crocodile, ‘ if you say truly what I shall do, I will 
restore it : if not, I will devour it “ You will devour it ! ” cried tlie distraeteti Motheiv 
** Now", said thè wily Crocodile, “ I cannot restore your Baby : for, if I d®, I shall make 
I wmm wr' ygH IF yoTT ’tìipóko* falsely, T would devour it “On 

thè contrary ", said thè yet wilier Mother, “ you cannot devour. my Baby : for, if you do* 
you will make me speak truly, and you promised me that, if I spoke truly, you would restore 
it ! " (We assume, of course, that he was a Crocodile of bis word ; and that his sense o£ 
honour outweighed his love of Babies.) 


§4- 

Antistrephoii. 

That is “ The Retort This is a talo of thè law-courts: 

“ Protagoras had agreed to train Euathius for thè professimi of a barrister, on thè 
condition that half his fee should be paid at oneo, and that thè othor half should be paid, 
or not paid, according as Euathius should win, or lose, bis first case in Court. After a time,. 
Protagoras, bocoming impatient, brought an action against his pupil, to recover thè second 
half of liis fee. It seems that Euathius decided to plead his own cause. “ Now, if I win 
this action ", said Protagoras, “ you will bave to pay thè money by thè decisimi of thè 
Court : if I lose it, you will bave to pay by our agreement. Tberofore, in any case, you 
must pay it “ On thè contrary”, retorted Euathius, “ if you win this action, I shall be 
released from payment by our agreement : if you lose it, I shall be released by thè decisioni 
of thè Court. Therefore, in any case, I need not pay thè money 


Le bozze di stampa scoperte dall’autore alla Christ Chureh di Oxford nel 1959 
furono il primo indizio di una possibile esistenza di più ampie porzioni del secondo 
libro, mancante, dedicato da Dodgson alla logica simbolica. Il numero segnato a penna 
sull’angolo sinistro in alto è di pugno di Dodgson, che teneva un registro di tutta la sua 
corrispondenza. Una piega nelle bozze copre parzialmente una riga del testo stampato. 


Qualunque ragionamento di questa 
forma, indipendentemente da ciò che 
viene sostituito a M, X e G, sarà valido. 

I logici aristotelici del Medioevo 
classificavano le forme di inferenza va¬ 
lide in base alla loro « figura » e al lo¬ 
ro « modo ». Le variazioni nelle posi¬ 
zioni dei termini di un sillogismo (nel¬ 
l’esempio M, X e G) sono denominate 
differenze di figura. Ciascuno dei sillo¬ 
gismi possiede anche un modo che è 
determinato dalla forma delle sue pro¬ 
posizioni componenti. Ci possono esse¬ 
re 15, 19, 24 o piu forme di inferenza 
valide, a seconda del tipo di classifica¬ 
zione impiegato. 

II problema sta nel fatto che ci so¬ 
no molti ragionamenti validi le cui re¬ 
gole di inferenza non si possono nep¬ 
pure formulare nel quadro della logi¬ 
ca aristotelica tradizionale. Per esem¬ 
pio: 

Rebecca è la madre di Giacomo 

Giacomo è il padre di Giuseppe 

La madre del padre è la nonna 

paterna 

.'. Rebecca è la nonna paterna di 
Giuseppe 

Il ragionamento può essere cosi for¬ 
mulato nel linguaggio della logica ari¬ 
stotelica: 

Tutti gli A sono B 

Tutti i C sono D 

Tutti gli E sono F 

Tutti gli A sono G. 

Ma una volta formulato in questo 
modo questo ragionamento valido è as¬ 
solutamente impossibile formulare una 
regola di inferenza valida per esso. Una 
espressione come « madre di Giacomo » 
è contratta in un singolo termine (B) 
e non può essere di nuovo analizzata. 
Si possono trovare facilmente altre 
espressioni che, una volta sostituite ai 
termini da A a G, produrranno un 
controesempio, tale da portare da una 
premessa vera a una conclusione falsa. 
La struttura logica del linguaggio del¬ 
le proposizioni categoriche aristoteli¬ 
che è troppo debole per rendere tra¬ 
sparente il modo in cui il predicato 
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« madre di Giacomo » contiene il sog¬ 
getto della seconda premessa e parte 
del soggetto della terza. 

Con l’attuale logica delle relazioni 
dare la regola di inferenza valida per 
questo esempio è assolutamente bana¬ 
le. Supponiamo che x, y e z stiano per 
Rebecca, Giacomo e Giuseppe, e che 
M, F e T stiano per le relazioni tra 
individui « madre di », « padre di» e 
« nonna materna di ». Allora 

« Mxy » 

« Fyz » 

« MF = T » 

« Txz » 

La regola di inferenza afferma che 
qualunque conclusione della forma lo¬ 
gica « Txz » è deducibile incondiziona¬ 
tamente dalle forme che compaiono 
sopra di essa. 

Uno degli obiettivi principali che 
presiedono alla costruzione dei calco¬ 
li della logica contemporanea è quello 
di ridurre sistematicamente le regole 
di inferenza al numero piu piccolo 
possibile. Di certo Dodgson si poneva 
lo stesso problema. Nella Logica Sim¬ 
bolica'. Parte I egli scriveva: « Per 
quanto riguarda i sillogismi, trovo che 
le loro diciannove forme, attorniate da 
tutto un insieme di altre che [i manua¬ 
li] hanno ignorato, si possono disporre 
tutte sotto tre forme, ciascuna con 
una semplicissima regola correlata ». 
Egli considerava la logica aristotelica 
come « una macchina pressoché inu¬ 
tile a scopi pratici, data l’incompletez¬ 
za di molte delle conclusioni, e l’omis¬ 
sione di molte forme del tutto legit¬ 
time ». 

■N 

evidente che Dodgson stava .cer¬ 
cando di spingersi oltre le forme 
tradizionali di argomentazione valida. 
Quali sono le acquisizioni' specifiche 
che gli si possono ora attribuire alla 
luce del suo lavoro inedito di logica 
simbolica? Per prima cosa va detto 
che nel corso del 1896 egli aveva svi¬ 
luppato una procedura meccanica di 
controllo della validità per buona par¬ 
te della logica dei termini, »un risulta¬ 
to abitualmente attribuito a Leopold 
Lowenheim. 

In secondo luogo, già dal 1894 Dodg¬ 
son usava tavole di verità per la solu¬ 
zione di problemi logici particolari. La 
applicazione di tavole di verità e ma¬ 
trici non divenne di uso comune prima 
del 1920. In terzo luogo, durante il 
1896 Dodgson aveva sviluppato il «me¬ 
todo degli alberi » per determinare la 
validità di argomentazioni che erano 
notevolmente complicate in rapporto 
alle normali capacità dei logici inglesi 
del suo tempo. L’idea chiave era quel¬ 
la di controllare se una conclusione 


SIMBOLO SIGNIFICATO 

x, L’indice sottoscritto 1 asserisce l’esistenza di x : «Alcune co¬ 
se esistenti hanno l’attributo x » o più brevemente « Qualche 
x esiste ». 

x' L’apice nega un termine o un enunciato. Se x significa « nuo¬ 
vo », x' significa « non-nuovo ». Quindi x' va letto « non-x ». 

x 0 L'indice sottoscritto 0 asserisce la non-esistenza di x: « Nes¬ 
suna cosa esistente ha l’attributo x » o, più brevemente, « Nes¬ 
sun x esiste ». 

xy, « Qualche xy esiste ». Quando in un’espressione ci sono due 
lettere, non importa quale sta per prima; il significato è iden¬ 
tico. L’espressione significa anche « Alcuni x sono y » e « Al¬ 
cuni y sono x ». 

xy 0 « Non esiste nessun xy », che è equivalente a « Nessun x è 
y » e a « Nessun y è x ». 

x,y'„ « Tutti gli x sono y ». L’indice sottoscritto 0 asserisce la non- 
-esistenza della combinazione x e y\ L’espressione ci dice 
che alcune cose-x esistono ma che nessuna di esse ha l’attri¬ 
buto y’ e, nel sistema di Dodgson, questo equivale alla pro¬ 
posizione « Tutti gli x sono y ». 

f La croce significa « e ». Quindi xy, f xy' 0 significa « Esiste 
qualche xy e non esiste nessun xy' » oppure « Alcuni x sono 
y e nessun x è non-y ». 

F Significa « se vero, dimostrerebbe » oppure « è derivabile 
da ». Quindi x F y significa « x dimostra y » oppure « y è de¬ 
rivabile da x ». 


Il metodo degli indici sottoscritti fu escogitato da Dodgson per rappresentare le 
proposizioni in forma stenografica. Ciascuno degli indici comincia ad avere effetto 
dall’inizio dell’espressione a cui è posposto, ma l’apice nega solamente il termine 
a cui viene accostato. Dodgson assumeva le proposizioni iniziami con « Tutti » (« Tut¬ 
ti gli x sono y ») come equivalenti alle due proposizioni « Ci sono alcuni x » e 
« Nessun x è non-y ». Nel convertire le proposizioni di tipo « Tutti » in forma sotto- 
scritta, il predicato doveva essere negato. Cosi «Tutti gli x sono y» è scritto «x,y'o» 
e letto o come « Nessun x è non-y » e « Alcuni x sono y » o come il loro equivalente 
«Tutti gli x sono y». Analogamente, «Tutti gli y sono non-x» diventa « y,x 0 » («Nes¬ 
sun y è x» e «Alcuni y sono non-x») e l’espressione « x\ y'o » è letta «Tutti i non-x 
sono y». Nel tradurre un enunciato «Tutti» da una forma all’altra il predicato (ulti¬ 
mo termine) passa sempre da positivo a negativo (da x a x') o da negativo a positivo. 


Si considerino le premesse; xm„ -j- ym\ 

Poiché m’ nega m, si possono eliminare ambedue i termini: 
xnii f ym\ 

Ciò che resta si può considerare una singola espressione: xy 0 
•\ xm a t ym\ F xy 0 

Per premesse multiple, in quella che Carroll chiama prima figura, 
il procedimento si ripete finché non si può eliminare altro. Ciò che ri¬ 
mane a questo punto sono i termini che compariranno nella conclusio¬ 
ne. Per esempio, se le premesse di partenza sono: 

Dati 1. 2. 3. 4. 

a ,c o o q 

Si combinino i dati 1 e 2, e si elimini a’a 

Si combinino i dati 1 e 3, e si elimini c’c 

Si combinino i dati 3 e 4, e si elimini b’b. 

Ciò che rimane è d,e' 0 . Questa è la conclusione. 

a\c\ f f c,ò' 0 f d,b Q ? d,e\ 


La derivazione di conclusioni da premesse formulate nel linguaggio con indici 
sottoscritti di Dodgson comporta spesso l’eliminazione di termini che si negano 
reciprocamente (me m', per esempio, giacché m' significa non-m). Dodgson preferiva 
cancellare i termini da eliminare anziché valersi del metodo qui descritto, ma i risulta¬ 
ti sono identici. La soluzione per il primo problema si può leggere: «Il fatto che 
nessun x è m e che nessun y è non-m, se fosse vero, dimostrerebbe che nessun x è y». 
Nel secondo problema si possono combinare le premesse finché non sono usate tutte. 
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ipoteticamente assunta come falsa, una 
volta congiunta con una serie di pre¬ 
messe assunte come vere, avrebbe por¬ 
tato a una contraddizione o a una as¬ 
surdità. La sua procedura presenta una 
sorprendente affinità con gli alberi fre¬ 
quentemente impiegati dai logici d’og¬ 
gi, in gran parte derivanti dal metodo 
delle « Tavole Semantiche » escogitato 
nel 1955 da Evert Willem Beth. 

Anche se Dodgson non si attenne 
mai ai canoni di rigore odierni, la sua 
anticipazione dei recenti sviluppi del¬ 
la logica è sufficiente a attestare la sua 


originalità. E tuttavia, malgrado il ca¬ 
rattere antiaristotelico di tanta parte 
del suo lavoro, Dodgson rimase ostina¬ 
tamente aristotelico su un punto: la 
« portata esistenziale » delle proposizio¬ 
ni universali. Egli sosteneva la tesi che 
un enunciato del tipo « Tutti », per 
esempio « Tutti gli uomini sono mor¬ 
tali », era equivalente ai due enuncia¬ 
ti « Non ci sono uomini non mortali » 
e « Alcuni uomini sono mortali ». Poi¬ 
ché ogni enunciato del tipo « Tutti » 
contiene un enunciato del tipo « Qual¬ 
che », tutti gli enunciati del tipo « Tut¬ 


Come esempio il più possibile semplice di questo Metodo prendiamo il Sillogi¬ 
smo della figura in basso a pagina 37, ossia xm 0 -j- ym\ ]f xy 0 . 

Qui i nostri dati sono due Nullità, xm, e ym ' 0 , che presentano l’Attributo m nel¬ 
la forma sia positiva che negativa-, il nostro Quaesitum è la Nullità xy 0 . 

Cominciamo coll’assumere che l’aggregato xy sia un'Entità: assumiamo cioè che 
Qualcosa di esistente abbia ambedue gli Attributi x e y. 

Ora la prima Premessa ci dice che x è incompatibile con m. Quindi la « Cosa » 
sotto considerazione che si assume sia in possesso dell’Attributo x non può avere 
l’Attributo m. Ma deve necessariamente avere omo m’, in quanto questi costitui¬ 
scono una Divisione esaustiva dell’intero Universo. Quindi deve avere l’attributo ni'. 

Analogamente, dalla seconda Premessa, possiamo dimostrare, come nostro secon¬ 
do risultato, che la « Cosa » sotto considerazione ha l’Attributo m. 

Questi due risultati, presi insieme, ci danno la sorprendente asserzione che que¬ 
sta « Cosa » ha ambedue gli attributi, m e m', simultaneamente-, cioè abbiamo 
xy, |J xym'm ,. 

Ora noi sappiamo che m e m' sono contraddittori-, quindi il risultato è eviden¬ 
temente assurdo : per cui torniamo alla nostra assunzione originale (che un aggre¬ 
gato xy fosse un’Entità) e diciamo « quindi xy non può essere un’Entità: in altre 
parole, è una Nullità ». 

Disponiamo ora questo ragionamento sotto forma di Albero. 

Per cominciare devo spiegare che tutti gli Alberi in questo sistema crescono a 
testa in giù: la radice è in cima, e i rami sono sotto. Se qualcuno obiettasse che 
il nome « Albero » non è appropriato, la mia risposta è che mi limito a seguire 
l’esempio di tutti gli autori che trattano di genealogia. Un « albero » genealogico 
cresce sempre verso il basso: perché un albero logico non potrebbe fare lo stesso? 

Dunque metterò la radice del mio Albero in alto. Essa consiste dell’aggregato 
xy; e il puro fatto di scrivere queste due lettere va inteso con questo significato 
(usando la forma regolare di una reductio ad absurdum): «l’aggregato xy sarà 
una Nullità; perché, altrimenti, poniamo sia un’Entità; sia cioè una data cosa esi¬ 
stente in possesso dei due attributi x e y ». 

Sotto questo « xy » allora pongo la lettera m' (questa fa parte del fusto del no¬ 


li significato di questo è che la « Cosa », che si assume sia in possesso dei due 
attributi x e y, deve anche avere l’attributo ni’: e il numero « 1 » vi rimanda alla 
prima premessa come garanzia per questa asserzione. 

Poi io pongo la lettera m sul lato destro di m’, e il numero « 2 », 
seguito da una virgola, sul lato sinistro dell’« 1 », cosicché 
il nostro Albero ora è. 


xy 

2, 1. in'm 


stro Albero), e sul suo lato sinistro pongo il numero « 1 », seguito xf- 

da un punto fermo, cosicché il nostro Albero è ora. 1. ni' 


Ciò significa che la « Cosa » deve avere anche l’attributo m, (cioè che xym’m è 
un'Entità) e che la garanzia per asserire questo è la seconda premessa. (Si osservi 
che le due lettere, nella linea inferiore, vanno lette da sinistra a destra, mentre i 
due numeri di riferimento da destra verso sinistra.) 

Ora noi sappiamo che m’ e m sono contraddittori : quindi è impossibile che un 
aggregato che li contiene entrambi sia un’Entità: quindi è una Nullità. Questo fat¬ 
to lo indico tracciando un piccolo cerchio (rappresentante un vuoto) 
sotto di esso, cosicché il nostro Albero ora è. 


xy 

2, 1. m’m 

O 


Il significato del cerchio è « L’aggregato degli Attributi, dalla radice a questo 
punto, è una Nullità ». 

Poi pongo sotto il circoletto la conclusione: « xy 0 », cosicché 



l’Albero ora è. 

Il significato dell’ultima riga è « Abbiamo ora dimostrato, dall’assunzione che 
xy fosse un’Entità, che questo aggregato, xym'm, deve essere una Entità. Ma esso 
è evidentemente una Nullità. Il che è assurdo. Quindi la nostra assunzione era 
falsa ». Quindi siamo in diritto di dire «Perciò xy è una Nullità». 


Il metodo degli alberi venne sviluppato da Dodgson come strumento per controllare la 
validità di una conclusione derivata da determinate premesse. Esso è sorprendentemen¬ 
te simile agli « alberi » frequentemente impiegati dai logici contemporanei. L’idea base 
è quella di assumere che le premesse siano vere ma che la conclusione sia falsa (e la 
sua negazione sia vera). Se combinando la negazione della conclusione con le premesse 
si giunge a un’assurdità, ciò prova che le premesse dimostravano veramente la conclu¬ 
sione. La spiegazione che viene data è stata tratta dalla sezione descrivente « il metodo 
degli alberi » nel lavoro inedito di Dodgson. Essa si riferisce a un semplice albero. 


ti » asseriscono 1’esistenza reale dei lo¬ 
ro soggetti. 

Verso la metà del XIX secolo i logici, 
e in particolare George Boole, avevano 
cominciato a negare che gli enunciati 
del tipo « Tutti » asserissero necessaria¬ 
mente 1’esistenza dei loro soggetti. L’in¬ 
terpretazione booleana oggi è quasi uni¬ 
versalmente accettata dai logici mate¬ 
matici (anche se nel 1964 ha trovato 
un oppositore in Richard B. Angeli 
della Wayne State University). Cosi 
dal punto di vista della maggior parte 
dei logici contemporanei la credenza di 
Dodgson nella « portata esistenziale » 
delle proposizioni universali compro¬ 
mette seriamente il suo contributo alla 
logica. (Cionondimeno, le tecniche di 
decisione e il formalismo di Dodgson 
si possono interpretare in modo tale 
da ottenere risultati booleani anziché 
aristotelici.) 

Per quanto le innovazioni tecniche 
di Dodgson siano storicamente interes¬ 
santi, i passi più affascinanti dei suoi 
scritti inediti sono quelli dedicati ai 
paradossi e ai rompicapi. Uno di essi, 
Un paradosso logico , fu pubblicato su 
« Mind » nel 1894 ed è ancora oggetto 
di una accesa polemica tra i logici 
contemporanei. Il problema chiama in 
causa una bottega di barbiere con ire 
barbieri che possono lasciare il nego¬ 
zio solo sotto determinate condizioni, 
che vengono formulate come premes¬ 
se (si veda la figura nella pagina a 
fronte). Tuttavia un ragionamento va¬ 
lido porta da queste due premesse a 
conclusioni contraddittorie. Dodgson 
parlò del paradosso del barbiere come 
di una « presentazione ornamentale » di 
una disputa tra lui e Wilson iniziata 
nel 1893. Questa si trascinò per più di 
dieci anni con un nutrito scambio di 
corrispondenza, gran parte della qua¬ 
le si conserva ancora e sarà forse pub¬ 
blicata, e con una serie di manoscritti, 
alcuni dei quali furono pubblicati pri¬ 
vatamente da Dodgson. 

U"n altro paradosso tratto dagli scrit¬ 
ti inediti riguarda l’antico problema 
del coccodrillo e del bambino. Scrive¬ 
va Dodgson: 

« La tragica storia si snoda cosi: 

Un coccodrillo aveva rapito un bam¬ 
bino sulle rive del Nilo. La madre lo 
supplicò di restituirle il caro piccino. 
“Orbene - disse il coccodrillo - se tu 
indovini ciò che io farò, te lo restitui¬ 
rò: altrimenti lo divorerò”. 

“Tu lo divorerai!” gridò la madre 
fuori di sé. 

“A questo punto - disse lo scaltro 
coccodrillo — io non posso restituirti il 
bambino: infatti se lo facessi ti farei 
dire il falso: e ti ho avvertito che, se 
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tu avessi detto il falso, io lo avrei di¬ 
vorato”. 

“Al contrario - disse la madre, an¬ 
cora più scaltramente - tu non puoi 
divorare il mio bambino: infatti se lo 
facessi mi faresti dire il vero, e tu mi 
hai promesso che se avessi detto il ve¬ 
ro me lo avresti restituito ! ” (Stiamo 
naturalmente ipotizzando che fosse un 
coccodrillo di parola e che il suo sen¬ 
so dell’onore fosse più forte del suo 
amore per i bambini) ». 

Dodgson quindi applica al problema 
la sua logica con indici sottoscritti e il 
suo « metodo degli alberi ». 

«Su questo sofisma [R. H.] Lotze 
fa la sconsolante osservazione che 
“Non c’è via d’uscita al dilemma”. Io 
penso, tuttavia, che l’apparato della lo¬ 
gica simbolica risulterà sufficiente alla 
sua soluzione. 

Sia Univ. l’universo; a = la madre 
dice la verità; b = il coccodrillo man¬ 
tiene la parola; c = il coccodrillo di¬ 
vora il bambino ». 

(Per negare un termine o un enun¬ 
ciato, Dodgson poneva un apice imme¬ 
diatamente dopo di esso. Cosi a' sta 
per « La madre dice il falso ». L’indi¬ 
ce sottoscritto 1 asserisce 1’esistenza 
del termine mentre l’indice 0 asserisce 
la sua non-esistenza. Cosi ab\C 0 stava a 
significare « Tutti gli ab sono non-c », 
che in questo particolare esempio vuol 
dire: « Ogniqualvolta la madre dice la 
verità e il coccodrillo mantiene la sua 
parola, allora il coccodrillo non divo¬ 
ra [restituisce] il bambino ». E c\a q si¬ 
gnifica « Tutti i non-c sono non-a », 
ovvero « Ogniqualvolta il coccodrillo 
restituisce il bambino, la madre dice il 
falso ».) 

« Allora abbiamo, come dati del pro¬ 
blema: 

1. aZ>,c 0 4. a’b\c 0 

2. ab\c' 0 5. c i a\ 0 

3. a’byC’o 6. c\a 0 

Possiamo ignorare 2 e 4 in quanto 

sono contenuti in 6 e 5; e vediamo 
che, all’analisi, va ritenuto soltanto b. 

b 
\ 

1 

a" 

5,3. cc' 

O 

.'. b 0 : cioè “qualunque cosa faccia il 
coccodrillo, viene meno alla sua pa¬ 
rola”. 

Il paradosso del barbiere fu pubblicato 
sulla rivista filosofica « Mind » nel lu¬ 
glio 1894, ma Dodgson chiaramente lo 
riservava al secondo volume della Logica 
Simbolica, insieme alla sua soluzione. Que¬ 
sta versione proviene dalle bozze inedite. 


c’a 
6. O 


« Come, non hai niente da fare? — disse zio Jim. — Allora vieni con me da 
Alien. E puoi farti un giretto mentre mi faccio radere». 

« Benissimo — disse zio Joe — e anche il cucciolo farebbe bene a venire, no? » 

Il cucciolo sono io, come il lettore avrà forse capito da solo. Ho compiuto i 
quindici anni più di tre mesi fa; ma non c’è verso di far capire questo a zio Joe, 
che si limiterebbe a dire: «Torna a cuccia, cucciolo!» oppure «Suppongo allora 
tu riesca a risolvere equazioni cubiche! » o qualche altra battuta egualmente igno¬ 
bile. Ieri mi chiese di dargli un esempio di proposizione in A, e io risposi « Tutti 
gli zii fanno ignobili giochi di parole ». Non penso gli sia piaciuto. Comunque, 
questo non ha nessuna particolare importanza. Ero abbastanza contento di andare 
con loro. Adoro sentire questi miei zii « discutere in termini logici », come usano 
dire; e ce la mettono tutta, ve l’assicuro! 

« Questa non è un’inferenza logica dalla mia affermazione », diceva zio Jim. 

« Mai detto una cosa del genere, è una reductio ad absurdum », diceva zio Joe. 

« Un illecito procedere del minore ! » buttò là zio Jim. 

Questo è il modo in cui discutono sempre, quando io sono con loro. Come se 
ci fosse chissà quale divertimento nel chiamarmi un minore! 

Dopo un po’ zio Jim ricominciò, proprio quando fummo in vista del barbiere. 
« Spero solo che Carr sia in bottega — disse. — Brown è così maldestro. E la mano 
di Alien è diventata malferma dopo che ha avuto quel febbrone ». 

« È cosa certa che Carr è in bottega », disse zio Joe. 

« Scommetto mezzo scellino che non c’èl », dissi io. 

« Risparmia le tue scommesse per occasioni migliori ■— disse zio Joe. — Voglio 
dire — si affrettò ad aggiungere, vedendo dal mio sogghigno che aveva fatto un 
passo falso —- voglio dire che posso dimostrarlo logicamente. Non dipende dal 
caso ». 

« Dimostralo logicamente ! — disse zio Jim, beffardo. — Sbrigati, ti sfido a 
farlo! » 

« Per amor di discussione ■—- cominciò zio Joe — supponiamo che Carr sia 
fuori. E vediamo 1 a che ci porterebbe questa assunzione. Farò questo per reductio 
ad absurdum». 

« Naturalmente! — borbottò zio' Jim — non ho mai visto un tuo ragionamento 
che non finisse in qualche assurdità! » 

« Senza lasciarmi provocare dai tuoi vili insulti — disse zio Joe con accenti 
elevati — vado avanti. Se Carr è fuori, mi concedi che, se Alien è anche fuori, 
Brown deve essere in bottegai » 

« Che vantaggio c’è nel fatto che ci sia lui in bottega? — disse zio Jim ■— Non 
voglio che Brown mi rada! È troppo maldestro ». 

« La pazienza è una di quelle inestimabili qualità... » cominciò a dire zio Joe; ma 
zio Jim tagliò corto. 

« Ragionai — disse — non moraleggiare ! » 

« Bene, ma tu ammetti questo? •— insistette zio Joe — Mi concedi che, se Carr 
è fuori, ne segue che se Alien è fuori Brown deve essere dentro? » 

« Certo che deve — disse zio Jim — altrimenti non ci sarebbe nessuno a oc¬ 
cuparsi del negozio ». 

« Vediamo, dunque, che l’assenza di Carr chiama in causa una certa ipotetica, 
la cui protasi è "Alien è fuori” e la cui apodosi è “Brown è dentro”. E vediamo 
che, finché Carr resta fuori, l’ipotetica resta valida? » 

« Bene, supponiamo di sì. E allora? » 

« Tu mi concederai anche che la verità di un’ipotetica, voglio dire la sua va¬ 
lidità come sequenza logica, non dipende nemmeno minimamente dal fatto che 
la protasi sia effettivamente vera, e nemmeno dal fatto che sia possibile. L’ipote¬ 
tica “Se tu dovessi correre da qui a Londra in cinque minuti sorprenderesti la 
gente” resta vera come sequenza, che tu lo possa fare o meno ». 

«Io non posso farlo», disse zio Jim. 

« Dobbiamo ora considerare un’altra ipotetica. Che mi hai detto ieri relativa¬ 
mente ad Alien? » 

« Ti ho detto •— disse zio Jim — che da quando ha avuto quella febbre l’uscire 
da solo lo rende nervoso, per cui si fa sempre accompagnare da Brown ». 

« Proprio così —■ disse zio Joe — Quindi, l’ipotetica “Se Alien è fuori Brown 
è fuori” è sempre valida, no? » 

« Suppongo di sì », disse zio Jim (Era lui a sembrare un po’ nervoso, ora). 

« Quindi, se Carr è fuori, abbiamo due ipotetiche, “Se Alien è fuori Brown è 
dentro” e “Se Alien è fuori Brown è fuori” simultaneamente valide. E due ipote¬ 
tiche incompatibili, bada bene! Non è possibile che siano.vere insieme!» 

« Non è possibilel » disse zio Jim. 

« E come potrebberol ■— disse zio Joe — Come potrebbe una stessa protasi di¬ 
mostrare due apodosi contraddittorie? Tu mi concedi che le due apodosi, “Brown 
è dentro” e “Brown è fuori” sono contraddittorie? » 

« Questo lo concedo » 

« Allora posso tirare le somme. — disse zio Joe — Se Carr è fuori, queste due 
ipotetiche sono vere insieme. E noi sappiamo che non possono essere vere insie¬ 
me. 11 che è assurdo. Perciò Carr non può essere fuori. Eccoti una bella reductio 
ad absurdum ! » 

Zio Jim sembrava profondamente perplesso; ma dopo un po’ riprese coraggio e 
ricominciò. « Non vedo del tutto chiaro circa questa incompatibilità. Perché non 
dovrebbero essere vere insieme queste due ipotetiche? Mi sembra che questo di¬ 
mostrerebbe semplicemente “Alien è dentro”. Naturalmente è chiaro che le apo¬ 
dosi di queste due ipotetiche, “Brown è dentro” e “Brown è fuori”, sono incom¬ 
patibili. Ma perché non dovremmo porre le cose così? Se Alien è fuori Brown è 
fuori. Se Carr e Alien sono entrambi fuori, Brown è dentro. 11 che è assurdo. Per¬ 
ciò Carr e Alien non possono essere entrambi fuori. Ma fintantoché Alien è den¬ 
tro non vedo cosa impedisca a Carr di andare fuori ». 

« Mio caro, ma assai illogico fratello! — disse zio Joe — (Ogniqualvolta zio 
Joe comincia a darti del “caro”, puoi star sicuro che ti ha messo in un bel guaio!) 
Non vedi che stai erroneamente scindendo la protasi dall 'apodosi dell’ipotetica? 
La protasi è semplicemente “Carr è fuori”; e Yapodosi è un tipo di sotto-ipote¬ 
tica, “se Alien è fuori, Brown è dentro”. Ed è semplicemente l’assunzione “Carr 
è fuori” che ha provocato questa assurdità. Per cui c’è una sola conclusione pos¬ 
sibile. Carr è dentro ! » 

Non ho la minima idea di quanto avrebbe potuto durare questa discussione. So¬ 
no convinto che sia l’uno che l’altro avrebbero potuto discutere per sei ore di 
seguito. Ma proprio in questo momento arrivammo alla bottega del barbiere; ed 
entrando trovammo .... 
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Cosi, se divora il bambino, le fa dire 
la verità, e quindi viene meno alla sua 
parola; se lo restituisce, le fa dire il 
falso, e quindi viene meno alla sua pa¬ 
rola. Essendo cosi frustrato senza spe¬ 
ranza il suo senso dell’onore, non pos¬ 
siamo dubitare che egli si comporte¬ 
rebbe secondo i dettami della sua se¬ 
conda passione dominante, il suo amo¬ 
re per i bambini! ». 

Osservando che i dati 2 e 4 sono 
contenuti nei dati 6 e 5 Dodgson in¬ 
tendeva dire che i primi sono logica¬ 
mente derivabili dai secondi. La con¬ 
clusione che si raggiunge applicando 
la regola di inferenza di Dodgson è 
« Nessun b esiste » oppure « Non ci so¬ 
no casi in cui il coccodrillo mantiene 
la parola » oppure, per usare le parole 
di Dodgson, « Qualunque cosa faccia 
viene meno alla sua parola ». 


L’albero logico è un’applicazione di 
un ragionamento per reductio ad ab- 
surdum all’assunzione ipotetica che b 0 
(non esiste nessun b) sia falso. Postu¬ 
liamo (b esiste). Questa informazio¬ 
ne, congiuntamente al primo dato (o 
premessa), consente due possibilità. La 
prima, sul ramo sinistro dell’albero, è 
a' (la madre dice il falso). Questo ri¬ 
sultato, tuttavia, congiuntamente a b, 
porta per la terza premessa a c, men¬ 
tre per la quinta premessa porta a c\ 
Poiché c e c' sono contraddittorie, la 
prima possibilità porta a una assurdità 
(indicata dal cerchio). La seconda pos¬ 
sibilità, rappresentata nel ramo destro 
dell’albero, di congiungere 6,» con la 
prima premessa produce c’a (il cocco¬ 
drillo restituisce il bambino e la madre 
dice la verità). Questo è in contrasto 
con la sesta premessa e porta pure a 


una assurdità. Se l’assunzione che il 
coccodrillo può talvolta mantenere la 
parola porta a un’assurdità, allora è 
vero che « Qualunque cosa faccia, il 
coccodrillo viene meno alla parola 
data ». 

Per verificare la nostra padronanza 
della tecnica di Dodgson, proviamoci a 
determinare ciò che succede se la ma¬ 
dre dice: « Tu restituirai il bambino ». 
Il dato 5 diventa c,a 0 (tutti i c sono 
non-a) e il dato 6 diventa c\a ' 0 (tutti i 
non-c sono a). Cioè « Se il coccodril¬ 
lo restituisce il bambino, la madre di¬ 
ce il vero ». Qui i dati 1 e 3 si posso¬ 
no trascurare in quanto sono derivabi¬ 
li dai dati 5 e 6. I dati rilevanti sono 
allora 2, 4, 5 e 6. La conclusione è b’ 0 , 
« Qualunque cosa faccia, il coccodril¬ 
lo mantiene la parola ». Per sottopor¬ 
re a controllo il ragionamento con il 


« Un rompicapo logico » 
di Lewis Carroll 

Ci sono tre proposizioni, A, B e C. 

Dato che 

« Se A è vera, B è vera;. (i) 

« Se C è vera, allora se A è vera B non è vera ». (ii) 

NEMO e OUTIS divergono sulla verità di C. 


NEMO dice che C non può essere vera; OUTIS sostiene il 
contrario. 

Ragionamento di NEMO 

Il numero (ii) si riduce a questo: 

« Se C è vera, allora (i) non è vera ». 

Ma, ex hypothesi, (i) è vera. 

C non può essere vera; infatti l’assunzione di C comporta 
un’assurdità. 

Risposta di OUTIS 

Le due asserzioni di NEMO, « se C è vera, allora (i) non è 
vera » e « l’assunzione di C comporta un’assurdità » sono er¬ 
ronee. 

L’assunzione di C da sola non comporta nessuna assurdità, 
in quanto le due ipotetiche « se A è vera B è vera » e « se A 
è vera B non è vera » sono compatibili-, cioè possono essere ve¬ 
re assieme, nel qual caso A non può essere vera. 

Ma l’assunzione di C e di A assieme comporta effettivamente 
un’assurdità, in quanto le due proposizioni « B è vera » e « B 
non è vera » sono incompatibili. 

Quindi segue non che C, presa da sola, non può essere vera, 
ma che C e A non possono essere vere insieme. 

Difesa di NEMO 

OUTIS ha erroneamente separato protasi e apodosi in (ii). 

L’assurdità non è l’ultima clausola di (ii), « B non è vera », 
ma con tutto ciò che segue la parola « allora », ossia l’ipotetica 
«se d è vera B non è vera » e, per (ii), è soltanto l’assunzione 
di C che genera questa assurdità. 

In effetti OUTIS ha reso (ii) equivalente a « Se C è vera 
[e A è vera] allora se d è vera B non è vera». Questo è un 
errore: le parole tra parentesi nella protasi composta sono su¬ 
perflue, e ciò che rimane è la vera protasi che condiziona l’apo- 
dosi assurda, come è evidente dalla forma di (ii) data origina¬ 
riamente. 

Questo teorema sulle ipotetiche — che le proposizioni nume¬ 
ro (i) e (ii) insieme dimostrano che C non può essere vera — 
possono essere illustrate dal seguente esempio algebrico: 


La risoluzione del paradosso del barbiere trovata tra le carte di 
Dodgson figura come la sua trattazione definitiva del problema. Egli 
riformula il paradosso in termini più astratti e procede, con ragio¬ 


Sia ax + (a — b) y + z = 5;. (1) 

bx + z = 6; . (2) 


L’equazione (1) si può formulare come un’ipotetica in questo 
modo: 

« Se ax, (a — b) y e z sono aggiunte l’una all’altra, si ottiene 
il numero “5” ». 

“A” stia a significare « ax, (a — b)y e z sono aggiunte l’una al¬ 
l’altra »; 

“B” stia a significare «si ottiene il numero “5”»; 

“C” stia a significare « a = b ». 

Allora abbiamo 

« Se A è vera, B è vera ». 

Si assuma che C sia vera; cioè che a = b. 

Allora (ax -f (a —■ b) y + z) diventa (bx + z) che, per l’equazio¬ 
ne (2), deve sempre essere = 6. 

Quindi 

« Se C è vera, allora se A è vera B non è vera ». 

Perciò C non può essere vera; 
cioè “a” non può essere = “b". 

Seconda risposta di OUTIS 

Questa risposta comprenderà (a) una dimostrazione che il « ra¬ 
gionamento di NEMO » è autodistruttivo; ((]) una dimostrazio¬ 
ne che il suo esempio algebrico è inadeguato in quanto non rap¬ 
presenta correttamente i dati; (y) una dimostrazione che, una 
volta corretto, esso conforta la tesi di OUTIS, ossia che le ipote¬ 
tiche (i) e (ii) dimostrano non che C, presa da sola, non può 
essere vera, ma che C e A non possono essere vere insieme; (8) 
una semplice dimostrazione del vero risultato di queste due ipo¬ 
tetiche. 

(a) 

Consideriamo la terna di ipotetiche (che chiameremo ( K ), (L) 
e (M)) 

(K) « Se A è vera, Y non è vera ». 

(L) « Se A è vera, Y è vera ». 

(M) « Se A non è vera, Y è vera ». 

Non si discuterà il fatto che ( L ) e (M), prese insieme, sono 
equivalenti alla categorica (che chiameremo “N”) «Y è vera». 
Quindi la terna di cui sopra è equivalente all’ipotetica e alla 
categorica 

( K) « Se A è vera, Y non è vera » 

(N) « Y è vera ». 

Per questa terna (o per la sua coppia equivalente) si possono 
proporre due diverse interpretazioni, ossia 

« (K) e (L) non possono essere vere insieme. Quindi (K), (L) 
e (M) non possono essere vere insieme ». 

« (A) e (N) possono essere vere insieme; cioè, (K), (L) e (M 
possono essere vere insieme ». 


namenti prò e contro, a discutere se C possa essere vera 
o meno (« Carr è fuori » nella versione originale). Nemo 
(zio J.oel sostiene il punto di vista di John Cook Wilson 
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metodo dell’albero logico di Dodgson, 
assumiamo che b' 0 sia falso e provia¬ 
mo a vedere se questo conduce o no 
a una assurdità. Se b' 0 è falso, allora 
b\ è vero, e questo, insieme alla secon¬ 
da premessa (dato), lascia aperte due 
possibilità. 

b' 


2 

a' ca 

6,4. c'c 5. O 

O 

La prima (ramo sinistro dell’albero) 
è a' (la madre dice il falso), ma a’b\ 
per la quarta premessa porta a c' e per 
la sesta a c. Avere c' e c insieme è as¬ 
surdo. La seconda possibilità è ca x (il 
ramo destro), che contraddice la quin¬ 
ta premessa ed è quindi assurda. Cosi 


b' deve essere vero e il coccodrillo, 
qualunque cosa faccia, mantiene la 
parola. 

TTn altro problema preso in conside¬ 
razione da Dodgson è il celebre 
« paradosso del mentitore ». Egli rife¬ 
risce la sua « forma più semplice » in 
questo modo: 

«Se un uomo dice “Sto dicendo 
una bugia”, e dice la verità, egli sta 
dicendo una bugia, e perciò dice il fal¬ 
so: ma se egli dice il falso non sta di¬ 
cendo una bugia e perciò dice la ve¬ 
rità ». 

Molti logici hanno in anni recenti 
accantonato il paradosso del mentito¬ 
re perché il paradosso sorge dal fatto 
di consentire rautoriferimento, ossia 
dal fatto di permettere agli enunciati 
di riferirsi alla loro stessa verità o fal¬ 


sità. Tale atteggiamento nasce proba¬ 
bilmente da una lettura troppo fretto¬ 
losa dell’articolo di Tarski II concetto 
di verità nei linguaggi formalizzati, ap¬ 
parso nel 1935, nel quale l’autore so¬ 
stiene che nessun linguaggio consisten¬ 
te può contenere i mezzi per parlare 
del significato o della verità delle sue 
stesse espressioni. Quando un linguag¬ 
gio consente invece l’autoriferimento, 
non sorprende che esso conduca a in¬ 
consistenze e paradossi. 

Lo stesso Dodgson prende in consi¬ 
derazione un suggerimento del genere, 
lo valuta seriamente e quindi lo re¬ 
spinge, tutto nel volgere di poche ri¬ 
ghe. Egli scrive: 

« 11 modo migliore per uscire dalla 
difficoltà [il paradosso del mentitore] 
sembra sia quello di sollevare la que¬ 
stione se la proposizione “Sto dicendo 


Queste interpretazioni sono incompatibili. 

Ora, quando NEMO dice « l’assunzione di C comporta un’as¬ 
surdità », l’assurdità a cui egli allude è la verità simultanea del¬ 
le due proposizioni « Se A è vera B è vera » e « Se A è vera B 
non è vera ». 

Queste due proposizioni sono ipotefiche di forma (L) e ( K ); 
nel dichiarare che l’assunzione della loro verità simultanea com¬ 
porta un’assurdità, NEMO virtualmente dichiara che esse non 
possono essere vere assieme. 

Qui, allora, egli adotta la prima interpretazione della terna 
di ipotetiche, (K), (L) e (M). 

Di nuovo, quando egli dice « C non può essere vera » le pre¬ 
messe da cui egli deduce la conclusione sono le due proposizio¬ 
ni « Se C è vera, allora (i) non è vera. Ma, ex hypothesi, (i) è 
vera ». 

Queste due proposizioni sono un’ipotetica e una categorica di 
forma ( K) e (<Y); nel dedurre da esse, considerate come premes¬ 
se, una conclusione, NEMO virtualmente dichiara che esse non 
possono essere vere insieme. 

Qui, allora, egli adotta la seconda interpretazione della terna 
di ipotetiche ( K ), (L) e (M). 

Così egli ha adottato, nel corso dello 1 stesso ragionamento, due 
interpretazioni incompatibili di questa terna. 

Quindi il ragionamento di NEMO è autodistruttivo. 

( 3 ) 

Esaminiamo ora l’esempio algebrico di NEMO. 

Egli ci dà le equazioni (1) e (2) come sempre vere. 

Quindi l’equazione 1) resta vera anche quando a = b. 

Quindi la sua seconda ipotetica è incompleta: essa dovrebbe 
essere « Se C è vera, allora se A è vera B è (per l’equazione 1) 
vera ma (per l’equazione 2) non vera ». 

Quindi il suo esempio algebrico è inadeguato, in quanto non 
rappresenta correttamente i dati. 

(Y> 

Le due ipotetiche, una volta formulate completamente, si pre¬ 
sentano così: 

« Se A è vera, B è (per l’equazione 1) vera»; 

« Se C è vera, allora se A è vera B è (per l’equazione 1) vera, 
na (per l’equazione 2) non vera ». 

Queste si possono formulare come tre ipotetiche, ossia: 

«Se d è vera, B è (per l’equazione 1) vera»; 

« Se C è vera, allora se A è vera B è (per l’equazione 1) vera »; 

« Se C è vera, allora se d è vera B è (per l’equazione 2) non 
era ». 

Possiamo omettere la seconda di queste, in quanto' non porta 

nessun risultato. Le altre due si possono più brevemente enun- 
iare così: 

« Se A e (1) sono vere, B è vera »; 


e Outis (zio Jim) quello di Dodgson. Dodgson mette l’ac¬ 
cento sul fatto che un condizionale è falso, solo quando 
l’antecedente è vero e la conclusione è falsa. La tavola 


« Se C e A e (2) sono vere, B non è vera ». 

E la conclusione corretta è non che C, presa da sola, non può 
essere vera, ma che C, A, (1) e (2) non possono essere tutte ve¬ 
re assieme. 

Ma A è sempre possibile; cosicché possiamo, se vogliamo, as¬ 
sumerla come sempre vera, e non farne menzione. 

Le due ipotetiche si possono ora scrivere così: 

« Se (1) è vera, B è vera ». 

« Se C e (2) sono vere, B non è vera ». 

Perciò C e (1) e (2) non possono essere tutte vere insieme, 
anche se due qualsiasi di esse possono essere vere da sole. 

Così, se C e (1) sono vere, allora (2) non può essere vera; 
cioè, s e a = b (per cui l’equazione 1 diventa « bx + z = 5 ») e 
se l’equazione 1 è vera, allora non può essere vero che 
bx + z — 6. 

In secondo luogo, se C e (2) sono vere, allora (1) non può es¬ 
sere vera: cioè, se a — b e bx + z = 6, allora non può essere 
vero che ax + (a- —■ b) y + z = 5. 

In terzo luogo, se (1) e (2) sono vere, allora C non può essere 
vera: cioè, se ambedue le equazioni date sono vere, allora a 
non può essere uguale a b. 

Questo esempio algebrico potrebbe facilmente fuorviare un 
lettore incauto, per il fatto che la sua conclusione, « C non può 
essere vera », è vera (in base all’assunzione che le equazioni 1 e 
2 sono sempre vere). La fallacia sta nel premettere la parola 
« Perciò », e quindi nell’asserire che questa conclusione segue 
dalle due ipotetiche. Questo non è vero: la ragione reale per cui 
C non può essere vera è che essa è incompatibile con le equazio¬ 
ni I e 2 (per sottrazione otteniamo ( a — b) (x + y) — — 1, da 
cui segue che (a — b ) non può essere uguale a 0 e cioè che a 
non può essere uguale a b ); le due ipotetiche da sole non lo 
dimostrano. 

(8) 

Ciò che risulta veramente dalle ipotetiche originali indicate con 
(i) e (ii) si può molto semplicemente esporre nel modo che segue: 

Stia “v” per « vero » e per « falso ». 

Ci sono 8 combinazioni concepibili di A, B e C, per quanto 
riguarda verità e falsità: queste sono: 



1. 

2. 

3. 

4. 

5. 

6. 

7. 

8. 

A. 

V 

V 

V 

V 

/ 

f 

/ 

/ 

B. 

V 

V 

/ 

f 

V 

V 

f 

t 

C. 

V 

/ 

V 

f 

V 

f 

V 

f 


Di queste, i numeri 3 e 4 sono proibiti da (i) e il numero 1 
è proibito da (ii). 

Le altre 5 combinazioni sono possibili; due di esse, ossia i 
numeri 5 e 7, contengono la condizione «C è vera », che NEMO 
riteneva impossibile. 

[settembre 1894] 


di verità viene usata per provare che ci sono situazioni possibili 
in cui C è vera. Questo paradosso con le sue ipotetiche in contra¬ 
sto ha sollevato problemi che ancor oggi sono oggetto di controversia. 
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Il paradosso del mentitore era l’oggetto della lettera in data 28 ottobre 1896, inviata 
da Dodgson a Wilson. In cima alla lettera Wilson ha scarabocchiato: «Questa lettera è 
un buon esempio delle straordinarie illusioni di cui è vittima Dodgson, per mancato 
studio della vera logica, o addirittura del reale processo del pensiero. J. C. W. ». 


una bugia” si possa supporre ragione¬ 
volmente tale da riferirsi a se stessa 
come proprio oggetto ». 

Egli concludeva che « Sto dicendo 
una bugia » non può essere autorizza¬ 
ta a riferirsi a se stessa « in quanto fa¬ 
re questo porterebbe ad un’assurdità ». 
Dodgson non si fermava qui. Egli pro¬ 
seguiva sottolineando che l’autoriferi- 
mento in sé e per sé non è criticabile 
e faceva rilevare che l’enunciato « Sto 
dicendo la verità » non porta ad assur¬ 
dità quando si riferisce a se stesso. 

Il punto essenziale, che Dodgson ha 
individuato chiaramente, è che alcuni 
enunciati autoreferenziali non creano 
nessuna difficoltà, mentre altri sono 
fonte di paradossi. Per esempio: 

L’enunciato contenuto in questo 
rettangolo è vero. 


L’enunciato contenuto in questo 
rettangolo è falso. 

Alan Ross Anderson dell’Università 
di Pittsburgh ha recentemente fatto il 
punto sulla situazione che si produr¬ 
rebbe se alcuni tipi particolari di auto¬ 
riferimento non venissero consentiti. 
Egli ha scritto: « Perderemmo virtual¬ 
mente tutti i campi più interessanti ne¬ 
gli studi contemporanei sui fondamen¬ 
ti filosofici della matematica. I teore¬ 
mi fondamentali della teoria degli in¬ 
siemi e della ricorsività scomparirebbe¬ 
ro, e logici e matematici di tutto il 
mondo si troverebbero disoccupati ». 


^he influenza potrà avere sulla logica 
contemporanea la pubblicazione del¬ 
la seconda parte della Logica Simboli¬ 
ca di Charles Lutwidge Dodgson? Alcu¬ 
ni logici proveranno grande interesse 
nel ricostruire l’evoluzione della pro¬ 
cedura di decisione di Dodgson e dei 
suoi metodi di controllo della validità; 
altri si divertiranno alle sue spiritose 
analisi di paradossi e rompicapi. L’im¬ 
pressione più grande sarà prodotta, 
credo, dagli 80 nuovi esercizi del libro. 
Per più di mezzo secolo i logici hanno 
saccheggiato per i loro testi e le loro 
dispense gli stravaganti problemi che 
Dodgson ha proposto nel primo volu¬ 
me della Logica Simbolica. In comples¬ 
so non vi hanno perso sopra molto 
tempo, in quanto Dodgson in quel li¬ 
bro dava anche le soluzioni degli eser¬ 
cizi. Soluzioni per alcuni dei nuovi 
esercizi sono state trovate, principal¬ 
mente nelle lettere di Dodgson a sua 
sorella e a Wilson: ma per la maggior 
parte dei problemi non è data, nel te¬ 
sto rimasto, nessuna soluzione. Se Le¬ 
wis Carroll potesse vederci alle prese 
con essi, ho il sospetto che ridacchie¬ 
rebbe di gusto. 
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Un nuovo livello di astrazione: 
la teoria delle categorie 

I progressi della matematica sono segnati dai progressi 
nelVastrazione. Da circa un quarto di secolo hanno 
acquistato una grande importanza le astrazioni di terzo grado 

di Lucio Lombardo Radice 


L a matematica è sempre astrazione. 
Anche ai suoi primordi. Anche 
nei suoi concetti più semplici: 
semplici, ma concetti. 

Astrazione è il numero naturale nel¬ 
la sua accezione cardinale, che è forse 
- anzi senza forse - il primo concetto 
matematico elaborato dall’uomo nella 
sua attività. Il numero cardinale non è 
un segno, non è il gruppo di tacche in¬ 
cise dal pastore primitivo all’ingres¬ 
so della grotta nella quale raccoglieva 
il gregge la sera, bensì l’astratto di una 
corrispondenza biunivoca tra due in¬ 
siemi (« per ogni pecora una tacca, per 
ogni tacca una pecora »), un fatto men¬ 
tale. Astrazione è il punto, l’atomo geo¬ 
metrico, « ciò che non ha parti » co¬ 
me diceva Euclide, e che tuttavia è il 
costituente ultimo di ogni lunghezza, 
di ogni superficie, di ogni solido nella 
loro schematizzazione mentale. Il pas¬ 
saggio dalla concezione fisica del pun¬ 
to, indivisibile ma materiale-esteso, pro¬ 
pria dei pitagorici, alla sua trasfigura¬ 
zione razionale - indispensabile per 
fondare la geometria - fu un vero e 
proprio passaggio al limite (dalla fisi¬ 
ca alla geometria, dallo spazio ambien¬ 
te reale alla sua idealizzazione) che ha 
richiesto secoli e forse millenni e che 
ha impegnato i più grandi scienziati- 
-filosofi dell’antichità classica, dai pita¬ 
gorici agli eleatici a Platone a Euclide 
ad Archimede. 

Quando si afferma che la matemati¬ 
ca è sempre, è tutta astrazione, si dice 
però ancora poco. Si traccia la linea 
di demarcazione tra matematica e spe¬ 
rimentazione naturalistica, ma non si 
fornisce un criterio per distinguere tra 
matematica e matematica. Il fatto è 
che la astrazione è un mondo, ed è un 
mondo complesso, un mondo in movi¬ 
mento, colle sue gerarchie o meglio i 
suoi livelli. Cosi, per dare l’esempio 
che tra un momento riprenderemo nel 
dettaglio, il concetto matematico ele¬ 


mentare di numero (naturale, intero e 
frazionario) diventa, insieme ad altre a- 
strazioni elementari a esso analoghe, il 
« materiale », l’« oggetto », cioè il pun¬ 
to di partenza per la costruzione di un 
concetto più generale, quello di anello 
del quale i numeri interi, oppure quel¬ 
li frazionari, sono « esempio concre¬ 
to », o meglio modello particolare. Il 
concetto di anello è uno dei tanti e- 
sempi di astrazione di secondo grado, 
cioè di sintesi mentale di concetti che 
derivano in modo diretto dal nostro 
operare sulla realtà, schematizzandolo 
(astrazioni di primo grado). Potremmo 
anche parlare di « schemi di fenome¬ 
ni » e di « schemi di schemi ». 

Le astrazioni di secondo grado, o 
schemi di schemi, hanno caratterizzato 
la matematica negli ultimi decenni del 
XIX secolo e nei primi del XX; l’han¬ 
no trasformata qualitativamente, ne 
hanno moltiplicato la potenza e han¬ 
no nel tempo stesso sconvolto le clas¬ 
sificazioni tradizionali, ristrutturando 
dalle fondamenta l’edificio matematico. 
(La classificazione tradizionale era fon¬ 
data su astrazioni di primo grado: a- 
ritmetica = scienza dei numeri; geo¬ 
metria = studio delle figure; alge¬ 
bra = teoria delle equazioni; la clas¬ 
sificazione attuale è fatta invece secon¬ 
do i tipi di struttura, cioè in base a 
schemi di schemi). Da un quarto di 
secolo circa hanno acquistato crescen¬ 
te importanza le astrazioni di terzo gra¬ 
do, cioè concetti che si collocano a un 
nuovo e più elevato livello di generali¬ 
tà, perché i loro « casi particolari » so¬ 
no astrazioni di secondo grado. 

Abbiamo in mente la cosiddetta « al¬ 
gebra universale », e più in particolare 
la « teoria delle categorie », l’atto di 
nascita della quale è una memoria del 
1945 degli statunitensi S. Eilemberg e 
S. Mac Lane. Poiché vorremmo risul¬ 
tare leggibili e intelleggibili anche a 
coloro che, senza essere matematici di 


professione, desiderano - legittimamen¬ 
te! - far proprie le più recenti conqui¬ 
ste di pensiero delle matematiche, do¬ 
vremo prendere le mosse dalle astra¬ 
zioni algebriche di secondo grado, ri¬ 
percorrendo il più rapidamente possi¬ 
bile un cammino lungo oltre un secolo. 

Q.ià nel 1847 George Boole afferma¬ 
va che l’algebra deve occuparsr 
« delle operazioni in sé considerate, in¬ 
dipendentemente dalle materie diverse 
alle quali possono essere applicate ». 
(Lo affermava nel libro The mathema- 
tical analysis of logie, mettendo in evi¬ 
denza le analogie formali tra disgiun¬ 
zione e congiunzione logica da una 
parte - « o », « e » - e addizione e 
moltiplicazione aritmetica - « + », 

« ■ » - dall’altra.) Non possiamo qui 
illustrare storicamente la elaborazione 
e la nascita delle astrazioni algebriche 
di secondo grado; ci limitiamo a defi¬ 
nire i concetti di anello e di gruppo, 
che diverranno a loro volta « incarna¬ 
zioni » particolari del concetto più ge¬ 
nerale di categoria, esempi « concreti » 
di categorie. I concetti di anello e di 
gruppo si avviano a discendere, rapida¬ 
mente, dalle università ai licei giù giù 
fino alla scuola media inferiore (con 
qualche puntata alle elementari in USA 
e URSS). Certamente nel giro di un 
decennio diverranno schemi mentali di 
uso corrente, non più « astrusi » del 
principio posizionale nella numerazio¬ 
ne o del calcolo letterale. Ma il decen¬ 
nio è appena all’inizio, ed è bene perciò 
dare definizioni esplicite e dettagliate. 

Il concetto di anello generalizza, co¬ 
me si è detto, quello di « numero ». Un 
anello è un insieme (= collezione) A 
di oggetti, di natura qualunque (non 
precisata), tra i quali sono definite due 
operazioni binarie (su coppie ordinate), 
anch’esse di natura non precisata. So¬ 
lo convenzionalmente le chiameremo 
« addizione » e « moltiplicazione », e- 
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stendendo il simbolismo e il linguaggio 
ordinario: « + » = « più »; « • » = 
« per »; « a + b » = somma di a e b; 
a-b prodotto di a e b (nell’ordine 
scritto). Per esprimere il fatto che in A 
sono definite le due operazioni « + » 
e « • » useremo il simbolo: A(+, •). 

Il « + » e il « • » di A possono non 
avere niente a che fare nel concreto 
con il « più » e il « per » della aritme¬ 
tica ordinaria: debbono verificare però 
una gran parte (e preciseremo quale) 
delle famose proprietà formali delle 
operazioni, che si studiano - con un 
certo tedio per solito - sotto il titolo 
aritmetica razionale. (Tra parentesi: si 
studiano con tedio quando non si co¬ 
noscono « + » e « • » diversi dal 
« piu » e dal « per » aritmetico, perché 
in tal caso quelle proprietà sembrano 
verità assolute, e con ciò banali). 

Elenchiamo, raggruppandole, le pro¬ 
prietà formali che si assumono co¬ 
me assiomi, che cioè si suppongono ve¬ 
rificate comunque si scelgano x , y 
z,... in A: 

a) Assiomi relativi alla addizione: 
a t ) x + (jy + z) = (x + y) + z , 

proprietà associativa; 

a 2 ) x + y = y + x, proprietà com¬ 
mutativa; 

a 3 ) (esistenza di un elemento neu¬ 
tro additivo, di uno « zero »). 

Esiste un elemento, che indicheremo 
con il simbolo 0, tale che: 0 + x = 
= x (e allora per a 2 ) anche x + 0 = 
= x); 

a 4 ) (esistenza dell’opposto) per ogni 
x di A esiste un x, suo opposto, tale 
che: x +x = 0 (si scrive: 3c = — x); 

b) Assiomi della moltiplicazione: 

bi) x-(y-z) = (x-y)-z, proprietà 
associativa. 

c) Assiomi di collegamento tra le 
due operazioni: 

Ci) x (y + z) = x-y + x z\ 
c 2 ) (y + z)-x = y-x + z-x; sono le 
due proprietà distributive, e occor¬ 
re scriverle tutte e due perché non 
si suppone a priori verificata la pro¬ 
prietà commutativa della moltiplica¬ 
zione. 

Quando in un insieme A sono defi¬ 
nite due operazioni + e • che verifica¬ 
no gli assiomi a), b), c), diremo che 
abbiamo fornito l’insieme A di una 
struttura di anello, oppure che A(+, •) 
è un anello. 

Un primo esempio di anello è offer¬ 
to dagli interi relativi (positivi e ne¬ 
gativi e lo zero; se prendiamo i soli 
positivi più lo zero cade a 4 )). Si usa il 
simbolo: Z(+, ■). 

I soli numeri pari, P(+, ■), costitui¬ 
scono un altro esempio di anello, « su¬ 
banello » di Z(+, -), e un primo esem¬ 
pio di anello senza elemento neutro 
moltiplicativo, senza « unità ». I multi¬ 


pli di 3, 4, 5,..., n,... forniscono altret¬ 
tanti esempi di anelli. 

Un anello è anche Q(+, •), l’insie¬ 
me dei numeri razionali o frazionari, 
« quozienti » di interi. In g(+, •) la 
moltiplicazione è commutativa; c'è la 
unità, 1, e inoltre ogni elemento non 
nullo x ammette un inverso x~ l = l/x, 
con x x -1 = 1. Quando un anello ve¬ 
rifica queste ulteriori proprietà si dice 
un campo. Campi sono anche i reali, 
f?(+, •), e i complessi, C(+, •). 

Anelli sono anche gli insiemi Z [x], 
Z [x, y],.. dei polinomi in una indeter¬ 
minata x, o in due indeterminate x, 
y, ecc., con coefficienti interi, rispetto 
alle usuali operazioni di addizione e 
moltiplicazione tra polinomi. Anelli so¬ 
no anche Z(x), Z(x, y),... che si otten¬ 
gono dai precedenti considerando non 
solo polinomi ma anche quozienti di 
polinomi (funzioni razionali). 

L’elenco, già molto ricco, delle 
« strutture concrete » (astrazioni di pri¬ 
mo grado) che rientrano nello schema 
formale di anello (astrazione di secon¬ 
do grado), non comprende ancora nes¬ 
sun esempio di una amplissima classe 
di anelli: quelli non commutativi. Ci¬ 
tiamo soltanto l’anello delle matrici 
quadrate di un dato ordine a elementi 
in Z (o in Q, o in R, o in C), rispetto 
all’addizione tra matrici (« elemento 
per elemento ») e alla loro moltiplica¬ 
zione righe per colonne, che verificano 
tutti gli assiomi prescritti, ma non la 
proprietà commutativa della moltipli¬ 
cazione (non prescritta!). 

g e in un anello A(+, •) consideriamo 

, solo l’operazione « + » e gli assio¬ 
mi a) a essa relativi, otteniamo altret¬ 
tanti esempi di gruppo commutativo, 
A(+). Sinonimo è gruppo abeliano, ag¬ 
gettivo scelto in memoria di N.E. Abel, 
uno dei pionieri della matematica mo¬ 
derna. Un esempio significativo di 
gruppo abeliano (con operazione « + » 
lontanissima dall’ordinario « più » del¬ 
l’aritmetica) è fornito dai vettori di un 
piano o dello spazio ordinario. Il « + », 
in questo caso, è l’addizione di vettori 
eseguita colla ben nota regola del « pa¬ 
rallelogramma delle forze » (il vettore 
somma di due, è la diagonale del pa¬ 
rallelogramma che ha per lati i due 
vettori addendi). A ogni vettore è as¬ 
sociata una traslazione, alla somma di 
due vettori la traslazione che si ottie¬ 
ne eseguendo successivamente (non im¬ 
porta in quale ordine) le traslazioni as¬ 
sociate ai vettori addendi; ecco un al¬ 
tro esempio, geometrico, di gruppo a- 
beliano, il gruppo delle traslazioni (del 
piano, o dello spazio). 

Il concetto - più generale - di grup¬ 
po si ottiene quando non si impone la 
commutatività a 2 ) della « composizio¬ 


ne », ferme restando a,), a 3 ), a 4 ). Ri¬ 
serberemo il simbolo di operazione 
« + » al caso di un gruppo abeliano 
mentre nel caso di un gruppo non (ne¬ 
cessariamente) commutativo useremo 
la notazione moltiplicativa con il rela¬ 
tivo linguaggio. Diremo insomma che 
G(-) è un gruppo se esiste una com¬ 
posizione (moltiplicazione) associativa 
[vedi a^], con un elemento neutro da 
chiamarsi unità, simbolo 1 [in questo 
caso a 2 ) diventa a' 2 ) 1 x — x-1 = x], e 
con un inverso per ogni elemento x 
[al posto di a 3 ) si ha a' 3 ): x-x~ l — 
= x~ l -x = 1], I gruppi non commu¬ 
tativi dominano la geometria. Non 
commutativo è il gruppo formato dai 
movimenti piani (rotazioni e traslazio¬ 
ni), o spaziali (sono i gruppi metrici); 
non commutativo il gruppo delle affi¬ 
nità, quello delle proiettività, ancora 
del piano o dello spazio; non commu¬ 
tativo il gruppo topologico del piano, 
cioè il gruppo che ha per elementi le 
trasformazioni biunivoche e bicontinue 
(senza « strappi » e senza « incollatu¬ 
re ») del piano in sé (pensiamo al pia¬ 
no come se fosse fatto di gomma). La 
« moltiplicazione » in tutti questi grup¬ 
pi geometrici, gli elementi dei quali 
sono trasformazioni in sé di una figu¬ 
ra, è il cosiddetto « prodotto operato¬ 
rio »: si ottiene il prodotto, per esem¬ 
pio, di due movimenti dati in un certo 
ordine eseguendoli l’uno dopo l’altro 
nell’ordine prescritto (il risultato è an¬ 
cora un movimento, da dirsi appunto 
il prodotto dei due nell’ordine dato). 

Gruppi, gruppi abeliani e anelli rien¬ 
trano - lo si intuisce subito - nel con¬ 
cetto più generale di « insieme fornito 
di operazioni che verificano determina¬ 
te regole », cioè di « struttura algebri¬ 
ca » (definita assiomaticamente). Per 
questa via si giunge, appunto, al con¬ 
cetto di struttura algebrica, non a quel¬ 
lo di categoria. Per trasformare le clas¬ 
si dei gruppi abeliani, dei gruppi, degli 
anelli (e molte altre classi ancora, di 
strutture algebriche e non), in esempi 
particolari del concetto generale di ca¬ 
tegoria, occorre mettere in luce anche 
un’altra analogia, più riposta, tra le 
classi in questione. 

Q uesta più riposta analogia risiede 
nella possibilità di associare a due 
gruppi abeliani (a due gruppi, a due a- 
nelli), diciamoli A e B, un particolare 
insieme di rappresentazioni, o applica¬ 
zioni, di A in B, e precisamente l’in¬ 
sieme Hom (A, B ) degli « omomorfi¬ 
smi » di A in B , ove per omomorfismo 
di A in B si intende una rappresenta¬ 
zione che rispetta (« conserva ») la 
struttura algebrica della quale A e B 
sono muniti. La cosa, detta cosi, risul¬ 
ta senza dubbio incomprensibile a chi 
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già non la sappia. Dobbiamo perciò 
fare qualche passo indietro, e comin¬ 
ciare a definire che cosa è una rappre¬ 
sentazione tra gli insiemi A e B, e poi 
introdurre in modo preciso la nozione 
di omomorfismo di un gruppo A(+) 
in un gruppo B( + ), di omomorfismo 
di un anello A( + , •) in un anello 
B(+, ■), e cosi via. 

Una rappresentazione di un insieme 
A in un insieme B è una cosa molto 
semplice; è una corrispondenza / che 
associa a ogni elemento a di A un ben 
determinato elemento di B, immagine 
di a in /, che potremo denotare col¬ 
l’ordinario simbolo funzionale f(a), op¬ 
pure con simboli che hanno lo stesso 
significato, e talvolta più comodi per 
ragioni tecniche, quali af, a f . 

Il linguaggio pittorico - « rappresen¬ 
tazione », « immagine » - non è casua¬ 
le. Si può pensare infatti A come un 
oggetto, B come un quadro sul quale 
dobbiamo rappresentarlo. Non si am¬ 
mette che un punto dell’oggetto A ab¬ 
bia due immagini in B (e quindi certe 
famose signore con doppio naso di Pa- 
blo Picasso non sono rappresentazioni 
nel nostro senso), ma non si pretende 
altro: a ogni punto di A dobbiamo as¬ 
sociare una e una sola immagine in B, 
ma la possiamo scegliere a nostro ca¬ 
priccio, non escludendo neppure il ca¬ 
so-limite che tutti i punti di A abbia¬ 
no come immagine un medesimo pun¬ 
to fisso in B. In questo ultimo caso, 
non viene utilizzato tutto il quadro B 
per rappresentare A, e cosi in tanti 
altri casi. Chiameremo immagine di A 
(in simboli: Im A) quella parte, o « sot¬ 
toinsieme », di B, che è costituita dal¬ 
le immagini dei punti di A e parle¬ 
remo (in generale) di « rappresentazione 
di A in B ». Quando si utilizza tutto il 
quadro B, cioè quando Im A coincide 
con B, la / si dirà una « rappresenta¬ 
zione di A su B » (una sovraiezione o 
suriezione). Se poi due punti distinti 
di A hanno sempre immagini distinte 
in /, si parlerà di iniezione (tra i punti 
di A e quelli di Im A c’è una corri¬ 
spondenza biunivoca: A è « iniettato » 
o « immerso » in B ). 

In una mostra d’arte non figurativa, 
nessuna rappresentazione di un sogget¬ 
to A su un quadro B potrà essere a 
priori esclusa; in una mostra fotografi¬ 
ca, invece, sono ammesse solo rappre¬ 
sentazioni di un tipo particolare, le 
rappresentazioni di un oggetto A su un 
quadro B che si ottengono proiettan¬ 
do A su B da un « centro di vista ». 
Nella rappresentazione topografica, la 
limitazione sarà ancora più pesante: 
vengono ammesse solo le rappresenta¬ 
zioni (di A in B ) cosiddette « in sca¬ 
la »; si ammettono deformazioni, ma 
secondo un ben determinato rapporto 


(scala). I bambini quando disegnano si 
permetteranno una maggiore libertà, 
faranno loro stessi grandi grandi accan¬ 
to a una casa piccola piccola, faranno 
diventare storto il diritto, ovale il ton¬ 
do; tuttavia, rispetteranno inconsape¬ 
volmente il principio della continuità, 
si serviranno di rappresentazioni (o ap¬ 
plicazioni) continue dell’oggetto A sul 
quadro B, deformando sì le figure, ma 
come se fossero di gomma, senza so¬ 
vrapposizioni né rotture (una circonfe¬ 
renza avrà per immagine un ovale, mai 
un segmento aperto!). 

Riflettiamo un momento sulle restri¬ 
zioni, tacite, poste al concetto di rap¬ 
presentazione di A in B nella foto¬ 
grafia, nella topografia, nel disegno in¬ 
fantile. Qual è il criterio generale a - 
stratto che presiede a tali restrizioni 
concrete? È il criterio della conserva¬ 
zione nell’immagine di qualche proprie¬ 
tà strutturale di A. Nel caso della foto¬ 
grafia, si pretende che punti allineati 
dell’oggetto vadano in punti allineati 
dell’immagine (a meno che non si so¬ 
vrappongano in un unico punto-imma¬ 
gine); nel caso della « carta topografi¬ 
ca », che non vengano alterati i rap¬ 
porti tra le lunghezze obiettive e le 
loro immagini; nel caso del disegno in¬ 
fantile, che sia conservata la relazione 
di contiguità o vicinanza tra punti, cioè 
la « struttura topologica » (in un senso 
da precisare, e ben precisabile). 

Quando rappresentiamo un gruppo 
(abeliano) A(+) in un gruppo (abe- 
liano) B(+), è perciò del tutto natu¬ 
rale limitarsi alle rappresentazioni che 
conservano la struttura di gruppo, 
cioè a quelle rappresentazioni f - da 
chiamarsi omomorfismi - di A in B 
tali che: 

(+) f(a + b) = f(a) + f(b) 

(a parole: il corrispondente della som¬ 
ma è la somma dei corrispondenti). Se 
abbiamo a che fare con due insiemi A 
e B nei quali siano definite - per inten¬ 
derci alla buona - le « stesse operazio¬ 
ni » (binarie), e siano + , -, °,... e quan¬ 
te altre vogliamo, diremo che la rap¬ 
presentazione / di A in B rispetta le 
operazioni ( è un omomorfismo tra A 
e B come strutture con quelle opera¬ 
zioni) se per ogni operazione 0 accade 
che: 

(0) f(a0b) f(a)0m. 

In particolare, la rappresentazione / di 
un anello A(+,-) in un anello B(+,-) 
si dirà un omomorfismo tra anelli se ol¬ 
tre alla (+) vale la: 

(•) f{a-b) = f(a)f(b). 

Chiariamo la cosa con qualche esem¬ 
pio. Consideriamo Z(+), cioè il gruppo 
abeliano formato dagli interi rispetto 
all’addizione. A ogni intero n facciamo 
corrispondere la sua metà w/2. La metà 
della somma di due interi è la somma 


delle loro metà; perciò la rappresenta¬ 
zione degli interi nei razionali che si 
ha associando a ogni n intero il nu¬ 
mero frazionario n/2, è un omomorfi¬ 
smo h di Z(+ ) in Q(+), gruppo abelia¬ 
no dei razionali rispetto alla addizione, 
Im h è l’insieme dei razionali a deno¬ 
minatore 2, i quali no)i esauriscono cer¬ 
to i razionali, ma ne costituiscono un 
sottogruppo rispetto all’addizione (e un 
sottoanello rispetto alle due operazioni 
di addizione e moltiplicazione). Invece 
h non è un omomorfismo dell’anello 
Z(+, •) nell’anello (campo) dei razionali 
Q(+, ■), perché il prodotto delle metà 
di due interi non è la metà, bensì la 
quarta parte, del prodotto dei due in¬ 
teri stessi. 

Consideriamo invece la rappresenta • 
zione / di Z in Q che a ogni intero n 
fa corrispondere il razionale n + 1/2: 

t(n) = n + 1/2. 

È subito visto che, mentre: 

t{n + m) = n + m + 1/2, 
si ha invece: 

t(n) + t(m) = n + 1/2 + 

+ m+l/2 = n + m+l; 
la t è una rappresentazione dell’insie¬ 
me Z nell’insieme Q, ma non è un 
omomorfismo del gruppo abeliano Z(+) 
nel gruppo abeliano Q(+). 

Consideriamo l’insieme Q' = Q — 0 
dei numeri frazionari (razionali) non 
nulli. Essi formano un gruppo (abe¬ 
liano) Q'() rispetto alla moltiplicazio¬ 
ne. Anche i soli razionali positivi, Q' + , 
costituiscono un gruppo £?'+(•), rispet¬ 
to alla moltiplicazione. Infine, l’insieme 
formato dai due soli numeri + 1, — 1, 
chiamiamolo S (iniziale di « segno »), 
costituisce del pari un gruppo rispetto 
alla moltiplicazione. Elenchiamo i se¬ 
guenti omomorfismi: 

p: di £>'+{■) in Q'(), definito facendo 
corrispondere a ogni reale positivo se 
stesso; 

q : di Q'(-) in S, definito facendo cor¬ 
rispondere a ogni positivo il numero 
+ 1 di S, a ogni negativo il numero 
— 1 (il corrispondente del prodotto è 
sempre il prodotto dei corrispondenti 
in virtù della ben nota regola dei segni). 

Il primo è « iniettivo », in quanto ele¬ 
menti distinti hanno immagini distinte; 
il secondo è « suriettivo » ma non iniet¬ 
tivo, perché tutti i positivi hanno la stes¬ 
sa immagine (+ 1), e cosi tutti i ne¬ 
gativi (— 1). Si chiama nucleo di un 
omomorfismo / di un gruppo A (abe¬ 
liano o non) in un gruppo B, e si indica 
con il simbolo Ker /, l’insieme degli ele¬ 
menti di A che hanno per immagine in 
/ l’elemento neutro di B (Ker è abbre¬ 
viazione dell’inglese kernel = nucleo). 
Se / è un omomorfismo di un anello A 
in un anello B, si chiama Ker / l’in¬ 
sieme degli elementi di A che hanno 
per immagine lo 0 di B. (Diamo un 
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esempio di omomorfismo di anelli. Sia 
Z 2 l’anello composto da due soli ele¬ 
menti: 0 = classe degli interi pari, T = 
= classe degli interi dispari. Allora si 
ha: 0 +0 = 1 + 1=0; 0+1 = 1 + 

+ 5 = 1; o-T = T-ó = o, 5.5 = 5, 

1-1 = 1, regole di calcolo che, lungi 
dall’essere folli, traducono in simboli 
fatti ben noti: pari + pari = pari = pa¬ 
ri = dispari più dispari ecc. Se a ogni 
pari di Z associamo lo 0 di Z 2 , a ogni 
dispari l’I, abbiamo un omomorfismo di 
Z(+, •) su Z 2 (+, •) che ha per nu¬ 
cleo il sottoanello P(+, •) dei pari.) 

Risulta subito che: 

Ker p = elemento neutro di Q' + , e 
basta. (In generale, in un omomorfismo 
iniettivo di A in B il nucleo si riduce al 
solo neutro di A). 

Ker q = Q' + , sottogruppo dei reali 
positivi. 

Riprenderemo questi esempi dopo 
una parentesi. 

■pv ata una rappresentazione p di A in 
B e una rappresentazione q di B in 
C. posso costruire la rappresentazione 
p°q di A in C nella quale all’elemento 
a di A corrisponde l’elemento c di C 
corrispondente in q del corrispondente 
di a in p; in simboli: 

p°q(a) = q(p(a)). 

A parole: la rappresentazione composta 
p°q si ottiene applicando successiva¬ 
mente p e q (prima la p, poi la q), cioè 
facendone il prodotto operatorio, il che 
ha un senso perché p porta da A in B 
e q riparte dallo stesso B per farci fi¬ 
nire in C. 

A questo punto, viene piuttosto spon¬ 
taneo aiutarsi con « frecce ». Invece di 
dire che p è una rappresentazione di 
A in B, faremo questo « disegno »: 

P 

A -» B 

Se poi vogliamo esprimere il fatto che 
la rappresentazione / di A in C è il pro¬ 
dotto operatorio, p°q, della rappresen¬ 
tazione p di A in B per quella q di B 
in C, diremo che il diagramma 

P 

A - >B 



f C 


è commutativo, cioè che si può andare 
da A in C indifferentemente per le due 
vie indicate, cioè in definitiva che: 

/(*) = p°q(x) = ?(pW) 

per ogni x in A. 

Se le rappresentazioni fattori p e q 
sono omomorfismi, per esempio di un 
gruppo A in un gruppo B, di un gruppo 


B in un gruppo C, si controlla senza 
difficoltà, sulla base della definizione di 
omomorfismo, che anche il loro prodot¬ 
to operatorio è un omomorfismo (di 
gruppi, di anelli o di altra struttura, se¬ 
condo i casi). 

Se ora ho tre rappresentazioni: la 
p di A in B, la q di B in C, la r di C 
in D, posso definire una rappresenta¬ 
zione p°q°r di A in C partendo da un 
x in A e andando a finire nell’elemento 
r(q(p(x)) in D (che è, a parole, il cor¬ 
rispondente in r del corrispondente in 
q del corrispondente in p di x); aiutan¬ 
dosi con frecce: 


P q r 



p°q°r 


cioè 

x-> p(x) --> q(p(x)) -» r(q(p{x))). 

Il punto di arrivo dipende solo dal pun¬ 
to di- partenza, non dal modo in cui si 
associano i singoli passaggi; in formule: 
(p°q)°r = p°(q°r). 

Insomma, quando di tre rappresenta¬ 
zioni si può fare il prodotto operatorio, 
perché l’insieme « di arrivo » della pri¬ 
ma è quello « di partenza » della secon¬ 
da e quello di arrivo della seconda è di 
partenza per la terza, allora tale pro¬ 
dotto è associativo. Lo stesso risultato 
vale se al posto di « rappresentazione 
di un insieme A in un insieme B » si 
parla di « omomorfismo di un gruppo 
A in un gruppo B », di « omomorfismo 
di un anello A in un anello B ». 

Diremo che la successione di omo¬ 
morfismi 

/ 8 

A - > A' - > A" 

è esatta se Im / = Ker g. Per esempio, 
la successione 

P q 

Q'+ - >Q' - 

è esatta per quanto si è visto poco fa, 
prima di aprire questa parentesi. 

T a « astrazione di secondo grado » 
che ci accingiamo a fare è, a questo 
punto, molto naturale. Invece di parla¬ 
re della classe degli insiemi (« tutti gli 
insiemi » non costituiscono un insie¬ 
me, ma una collezione « più grossa », 
una « classe »), o di quella dei gruppi, 
o di quella degli anelli, parliamo di una 
classe di oggetti, da « particolarizzare » 
volta a volta negli insiemi, nei gruppi, B 
negli anelli. Dunque, dare una catego¬ 
ria C vuol dire innanzitutto considerare 


una classe di oggetti, in simboli: Ob C. 
Ma non basta, per quanto sopra detto. 
Scelti comunque due oggetti, e siano 
A e B, in un certo ordine, per esempio 
prima A e poi B, alla coppia (A, B ) de¬ 
ve rimanere associato un insieme di 
morfìsmi di A in B, Hom (A, B). (Per 
essere precisi occorrerebbe scrivere 
Hom c (A, B) per indicare che si tratta 
dei morfìsmi da A e B nella catego¬ 
ria C). I morfìsmi saranno da partico¬ 
larizzare volta a volta nelle rappresen¬ 
tazioni di un insieme A in un insieme 
B, negli omomorfismi di un gruppo A 
in un gruppo B, oppure di un anello A 
in un anello B, ecc. 

Si pretende poi, e anche questo è na¬ 
turale dopo i « casi particolari » esami¬ 
nati, che si possa comporre (moltipli¬ 
care) un morfismo da A a B con un 
morfismo da B a C in modo da otte¬ 
nere un morfismo da A a C, e che det¬ 
ta composizione (nei casi in cui è de¬ 
finita) sia associativa. In altri termini, 
dati p in Hom (A, B), q in Hom (B, C) 
e r in Hom (C, D), si ha: 

a) p°(q°r) = ( p°q)°r, 

dove i morfìsmi composti a primo e a 
secondo membro sono definiti per l’ipo¬ 
tesi sopra fatta della componibilità (sim¬ 
bolo °) di un morfismo da A a B con un 
morfismo da B a D e, rispettivamente, 
di un morfismo da A a C con un mor¬ 
fismo da C a D. 

Non basta. Nei casi « concreti » 
(cioè... meno astratti) sopra considerati, 
comunque scelto l’oggetto A esisteva 
sempre un morfismo identico, e preci¬ 
samente la rappresentazione identica 
dell’insieme A in se stesso: l’omomorfi¬ 
smo di un gruppo - oppure di un anel¬ 
lo - A in se stesso che si ottiene facen¬ 
do corrispondere a ogni elemento di A 
se stesso. Il morfismo identico, o iden¬ 
tità, 1 A da A in A gode in tutti questi 
casi concreti di una proprietà caratte¬ 
ristica esprimibile nei termini della so¬ 
la composizione di morfìsmi: 1 A è ele¬ 
mento neutro, o indifferente, in tale 
composizione, quando lo si componga 
a destra con un morfismo da B (qua¬ 
lunque) in A, oppure a sinistra con un 
morfismo di A in B (qualunque). Insom- 
ma, se p è un morfismo di B in A, q 
un morfismo da A in B: 

i) p° 1 A = p , 1 A °q = q 

(si pensi a rappresentazioni tra insiemi; 
un x di B va in un p(x) di A, il quale 
resta fermo se si applica successiva¬ 
mente l’identità di A, 1 A , ecc.). La cosa 
risulta più chiara con un disegno: 
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Aggiungiamo infine la richiesta che 
Hom (A, B) e Hom (A', B') non ab¬ 
biano nessun elemento comune se le 
coppie (A, B ) e (A', B') sono distinte, 
e siamo arrivati a una rigorosa defini¬ 
zione astratta di categoria. La riassu¬ 
miamo: 

Una categoria C è una classe di og¬ 
getti, Ob C, tale che a ogni coppia or¬ 
dinata di oggetti, (A, B), è associato un 
insieme di elementi, detti morfismi di 
A in B, Hom (A, B); si ha inoltre che 
i morfismi di Hom (A, B) si possono 
comporre con quelli di Hom (B, C) 
dando luogo a morfismi di Hom (A, 
C), e che tale composizione è associati¬ 
va (quando è definita); in Hom (A, A), 
comunque si scelga l’oggetto A, esiste 
un morfismo identico, 1 A , cioè tale che 
valgono le (i); se le coppie (A, B), (A', 
B') sono distinte, Hom (A, B) e Hom 
(A', B') non hanno elementi a co¬ 
mune. 

g iamo pervenuti al concetto generale 

di categoria partendo dalle classi 
degli insiemi, dei gruppi, dei gruppi abe- 
liani, degli anelli e dai loro « morfi¬ 
smi », assiomatizzando (« schematiz¬ 
zando ») alcune proprietà formali co¬ 
muni ai vari casi. Perciò, viceversa, ab¬ 
biamo subito a disposizione quattro 
esempi di categorie: 1) la categoria de¬ 
gli insiemi, Ens (iniziali di ensemble), 
nella quale i morfismi sono le ordina¬ 
rie rappresentazioni, o applicazioni di 
un insieme in un altro. (In altri termi¬ 
ni ancora, le funzioni che hanno per 
dominio A e per codominio B ). 2) La 
categoria dei gruppi, Grp; i morfismi 
sono gli omomorfismi gruppali (appli¬ 
cazioni nelle quali il corrispondente del 
composto è il composto dei corrispon¬ 
denti: esse rispettano cioè la composi¬ 
zione gruppale). 3) La categoria dei 
gruppi abeliani o commutativi, Ab, sot¬ 
tocategoria della precedente in quanto 
gli oggetti di Ab sono oggetti anche di 
Grp e i morfismi Hom (A, B) con A e 
B in Ab sono anche morfismi di Grp. 
4) La categoria degli anelli, Rng (ab¬ 
breviazione di ring)', morfismi sono gli 
omomorfismi di anelli, cioè le rappre¬ 
sentazioni di un anello A in un anello 
B che conservano, o meglio « rispetta¬ 
no », tutte e due le operazioni definite 
in un anello. 

Potremmo elencare molte altre ca¬ 
tegorie relative all’algebra: quella dei 
moduli, quella dei reticoli, quella delle 
« omega-algebre » per un certo com¬ 
plesso di operazioni « omega ». Ma esse 
non ci darebbero nulla di qualitativa¬ 
mente originale, rispetto agli esempi 2), 
3), 4). Si tratta, infatti, caso per caso, 
di prendere insiemi con certe ope¬ 
razioni, verificanti eventualmente deter¬ 
minati assiomi, come oggetti di una ca¬ 


tegoria C, e come morfismi tra coppie 
di elementi di C le rappresentazioni che 
conservano le operazioni. Preferiamo 
perciò aggiungere due esempi qualitati¬ 
vamente diversi dai precedenti e tra di 
loro. 5) La categoria degli spazi topo¬ 
logici, Tps (topological spaces). Dati 
due spazi topologici A e B, l’insieme 
Hom (A, B) è costituito dalle applica¬ 
zioni continue di A in B. (Non possia¬ 
mo dare definizioni rigorose; ancora 
una volta, ci riferiamo alla idea intui¬ 
tiva di « rappresentazione continua » 
come « disegno » che altera si le for¬ 
me e le distanze, rispettando però i rap¬ 
porti di continuità. 6) La categoria che 
ha per unico oggetto il « monoide » 
moltiplicativo degli interi non nulli, 
Z(-), e come morfismi di Z in Z le cor¬ 
rispondenze (moltiplicazioni per un nu¬ 
mero fisso z): 

a - >a-z (a variabile in Z). 

(Gli interi, zero escluso, rispetto alla 
moltiplicazione hanno un elemento neu¬ 
tro, l’l, e godono della proprietà asso¬ 
ciativa, ma in generale un intero non 
possiede un inverso nell’ambito degli 
interi; perciò Z(-) non è un gruppo, ma 
- appunto - un « monoide ».) 

Bastano già questi pochi esempi, cre¬ 
diamo, per far comprendere la « por¬ 
tata » del concetto di categoria. Una 
portata cosi vasta, da far temere - a 
prima impressione - che la teoria sia 
povera di risultati, perché troppo estesa. 
Cosi non è. Prima di fare però qualche 
osservazione (conclusiva) sulla proble¬ 
matica e sui risultati della teoria delle 
categorie, vogliamo introdurre altri due 
concetti fondamentali: quello di cate¬ 
goria duale, C*, di una categoria C, e 
quello di funtore da una categoria C a 
una categoria C’. 

«D ualizzare » significa molto spesso in 

algebra « scambiare la destra col¬ 
la sinistra ». Nel caso di una categoria, 
C, posso costruire un’altra categoria, la 
sua duale (o opposta), C*, oppure C op , 
lasciando immutati gli oggetti, e chia¬ 
mando (ribattezzando) morfismo da B 
ad A un morfismo da A a B della ca¬ 
tegoria C. Insomma: 

Categoria duale C* di una catego¬ 
ria C: 

a) Ob C* = Ob C; 

b) i morfismi da B ad A nella C* 
sono tutti e soli i morfismi da A a B 
della C ; cioè u appartiene a Hom c . 
( B , A) se e soltanto se u appartiene a 
Hom c (A, B). 

I conti si fanno tornare, definendo il 
prodotto vu in C* tra un morfismo v 
da C a B e un morfismo u da B ad A 
come il morfismo w°v composto di u e 
v nella C; u°v infatti è nella C un mor¬ 
fismo da A a C, e quindi nella sua dua¬ 
le un morfismo da C ad A. Insomma, 


facendo attenzione all’ordine in cui so¬ 
no scritti i fattori, il prodotto di v per 
u nella duale è il prodotto di u per v 
nella categoria di partenza. (Abbiamo 
usato simboli diversi per la composizio¬ 
ne di morfismi in C e in C*: u°v e vu 
rispettivamente). 

La dualità, scambio di posto tra de¬ 
stra e sinistra, si esprime efficacemente 
nella teoria delle categorie come cam¬ 
biamento di verso delle frecce. Infatti 
il passaggio dalla C alla sua duale C*, 
che forse è risultato oscuro a parole, 
diventa chiarissimo graficamente: basta 
cambiare verso alle frecce! 

In C : 


u v 



u°v 


In C*: 


u v 



vu 


Il concetto di funtore generalizza 
quello di funzione (applicazione, rap¬ 
presentazione). Poiché in una categoria 
abbiamo a che fare non solo con og¬ 
getti, ma anche con morfismi, un fun¬ 
tore dalla categoria C alla categoria C’ 
sarà una « doppia funzione », F; si ha 
cioè che: 

a) a ogni oggetto A di C corrispon¬ 
de un oggetto F(C) di C'\ 

b) a ogni morfismo h di A in B, A e 
B oggetti di C, corrisponde un morfi¬ 
smo F(/i) di F(A) in F(B), in modo ta¬ 
le che: 

bf) sia conservata la composizione di 
morfismi: 

F(h°k) = F(h)°F(k) ( k è un morfismo 

da B in C); 

b 2 ) siano conservate le identità: 

pa A ) = i Fw 

(l’identità dell’oggetto A di C viene por¬ 
tata nella identità dell’oggetto corri¬ 
spondente ad A nella C', tramite F). 

Questa è, per essere precisi, la de¬ 
finizione di funtore covariante da C a 
C'; la definizione di funtore controva¬ 
riante si ottiene sotituendo alla b) la 

b') a ogni h di Hom (A, B) corrispon¬ 
de un F(/z) di F(B) in F(A) in modo 
tale che: 

b\) F(h°k) = F(k)°F(h). 

Quando passiamo dalla categoria C 
alla sua duale C*, facendo corrisponde¬ 
re a ogni oggetto se stesso, al morfismo 
u di A in B (in C) un morfismo u* = 
= u di B in A nella C*, introduciamo 
appunto un funtore controvariante dalla 
C alla C*. Un esempio banale di fun¬ 
tore covariante, da una categoria C a 
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se stessa, è la « doppia identità »: tanto 
a ogni oggetto, quanto a ogni morfi- 
smo, si fa corrispondere se stesso. An¬ 
cora due esempi di funtori, l’uno cova¬ 
riante, l’altro controvariante. 

Funtore morfismo covariante. Si fìs¬ 
sa un oggetto A in una categoria C; a 
ogni oggetto A di C si fa corrispondere 
l'insieme Hom (A, X) dei morfìsmi di 
A in X. In questo modo, a ogni oggetto 
X della categoria C resta associato un 
oggetto, h A (X) = Hom (A, X), della ca¬ 
tegoria degli insiemi, Ens. Sia dato un 
morfismo / da X a Y. A / possiamo as¬ 
sociare una rappresentazione (morfismo 
di insiemi), h A (f) dell’insieme Hom (A, 
X) nell’insieme Hom (A, Y), nel modo 
suggerito da questo diagramma: 

h 

A -» X 

h °\ /< 

Y 

Precisamente; a ogni h di Hom (A, X) 
facciamo corrispondere l’elemento h°f 
di Hom (A, Y). 

F untore morfismo controvariante. 
Fissato A nella C, a ogni oggetto X 
della C facciamo corrispondere l’insie¬ 
me Hom (X, A) dei morfìsmi di A in A; 
a ogni morfismo / di X in Y possiamo 
associare allora una rappresentazione di 
Hom (Y, A) in Hom (A, A) (attenzio¬ 
ne, c’è stato lo scambio di posto tra 
A e Y!), e precisamente quella che fa 
corrispondere al morfismo h di Y in A 
il morfismo f°h di A in A, come il dia¬ 
gramma illustra: 


f°h 

A < - A 



Y 


£i troviamo a questo punto di fronte 
a una difficoltà. Perché la teoria 
delle categorie unifichi le diverse teo¬ 
rie di « secondo livello » che in essa si 
inquadrano (insiemi, gruppi, anelli, spa¬ 
zi topologici e cosi via), occorrerà bene 
tradurre in linguaggio categorico alcuni, 
almeno, tra i concetti fondamentali che 
abbiamo già richiamato, e che elenchia¬ 
mo ora alla rinfusa: iniezione, surie- 
zione, elemento neutro (« zero » nella 
scrittura additiva), nucleo, immagine, 
successione esatta. Non è detto che ogni 
categoria abbia un elemento zero; ma 
come possiamo esprimere in linguag¬ 
gio puramente categorico il fatto che la 
categoria dei gruppi abeliani, o quella 
degli anelli, hanno un elemento zero, 
cioè che esiste un gruppo abeliano (o 


un anello) ridotto al solo elemento neu¬ 
tro additivo? 

La risposta è sorprendentemente più 
facile di quanto non ci si aspetti a pri¬ 
ma impressione. Consideriamo un grup¬ 
po abeliano qualunque, A, e lo zero- 
-gruppo abeliano, composto dal solo ele¬ 
mento 0, colla regola 0 + 0 = 0. Eb¬ 
bene: a) esiste uno e un solo omomorfi¬ 
smo da 0 in A: quello che manda 0 
nell’elemento neutro di A (un omo¬ 
morfismo tra gruppi è obbligato a spe¬ 
dire l’elemento neutro del primo nel¬ 
l’elemento neutro del secondo); b) esi¬ 
ste uno e un solo omomorfismo da A 
a 0. (Se c’è, deve essere per forza la 
applicazione che manda ogni elemento 
di A nell’unico elemento, 0, dello zero- 
-gruppo, perché... non ci sono altri po¬ 
sti nei quali collocare le immagini degli 
elementi di A; tale rappresentazione è 
effettivamente un omomorfismo, perché, 
essendo 0 + 0 = 0, si ha banalmente 
che l’immagine della somma di due ele¬ 
menti è sempre la somma delle loro im¬ 
magini.) 

Ma la a) e la b) possono subito essere 
trascritte in termini strettamente catego¬ 
rici. Diremo che una categoria C pos¬ 
siede uno zero-oggetto, 0, se: 

a) Hom (0, A) contiene uno e un 
solo elemento per ogni A di C; in que¬ 
sto caso si dice che 0 è un oggetto ini¬ 
ziale; 

b) Hom (A, 0) contiene uno e un 
solo elemento per ogni A di C; si dice 
in tal caso che 0 è un oggetto finale. 

(I concetti di oggetto iniziale e ogget¬ 
to finale, sia osservato tra parentesi, so¬ 
no duali.) La categoria degli insiemi pos¬ 
siede oggetti finali: essi sono gli insie¬ 
mi composti da un singolo punto, o 
singletons all’inglese. Possiede anche un 
oggetto iniziale, che è l’insieme vuoto 
(privo del tutto di elementi; allora l’uni¬ 
ca rappresentazione possibile dell’insie¬ 
me vuoto in un altro insieme è quella 
vuota, nella quale... non c’è da far cor¬ 
rispondere niente a niente, per mancan¬ 
za di elementi da rappresentare). La 
categoria degli insiemi non possiede pe¬ 
rò uno zero-oggetto, che è invece pos¬ 
seduto dalla categoria dei gruppi abe¬ 
liani, da quella degli anelli, da quella 
dei gruppi (è il gruppo identico, che 
scritto moltiplicativamente è il gruppo 
con il solo elemento 1, con la compo¬ 
sizione 1-1 = 1). 

Diamo di colpo la traduzione cate¬ 
gorica dei concetti insiemistici di inie¬ 
zione e suriezione, che sono resi rispet¬ 
tivamente dai termini monomorfismo ed 
epimorfìsmo, tra di loro duali (come il 
lettore vedrà dai disegni). 

Un morfismo da A a B si chiama un 
monomorfismo se, quale che sia C, da 
f°a = g°a (con f e g morfìsmi da C ad 


A), si può dedurre: 

f = g- 

Insomma se 

f 

_ a 

C _ > A ->B 

g 

è commutativo, allora f = g. 

Dualmente, un morfismo a da fi ad 
A si chiama un epimorfìsmo se da 
a°f = a°g, con / e g morfìsmi da A a 
C, si deduce / = g (quale che sia C). 
Invertiamo le frecce, e abbiamo: 

/ 

a _ > 

fi-» A _ 

g 

è commutativo, allora f = g. 

Giustifichiamo, almeno a metà, la se¬ 
conda definizione, facendo vedere che 
una suriezione in senso insiemistico è 
un epimorfìsmo in senso categorico. Se 
fi, A, C sono insiemi, e se a è una 
applicazione di fi su A, allora comun¬ 
que si scelga un elemento x in A, esi¬ 
ste un y in fi tale che a(y) = x. Suppo¬ 
niamo che si abbia a°f = g°f; ciò vuol 
dire che per ogni y in fi si ha a°f(y) = 
= a°g(y), cioè: 

f(a(y)) = g(a(y)) per ogni y in fi, 
cioè ancora, visto che a è una surie¬ 
zione: 

f(x) = g(x) per ogni x in A, 
il che significa, appunto, / identica a g. 
Poiché si dimostra facilmente che se a 
non è una suriezione tra gli insiemi fi 
e A, allora a non è neppure un epi- 
morfismo, ecco che la definizione cate¬ 
gorica di epimorfìsmo corrisponde a 
una proprietà caratteristica delle surie- 
zioni tra insiemi. Analogamente, si ve¬ 
de che i monomorfismi, nella categoria 
degli insiemi, sono tutte e sole le inie¬ 
zioni. 

Si apre, è il caso di dirlo, un nuovo 
mondo; o meglio, si può costruire un 
nuovo vocabolario, nel quale acquista¬ 
no senso categorico i termini « immagi¬ 
ne », « nucleo », « inclusione », « sotto¬ 
oggetto », « sequenza esatta » e cosi 
via; il nuovo significato, categorico, col¬ 
lima con il significato « ordinario », in¬ 
siemistico o gruppale, dei termini. 

Siamo alla fine del nostro articolo, 
siamo al principio della teoria delle ca¬ 
tegorie. Possiamo forse azzardarci a tra¬ 
scrivere, lasciando nel vago qualche 
termine, l’enunciato del primo teorema 
di teoria delle categorie di una certa 
consistenza, il cosiddetto « Lemma dei 
nove soggetti » o brevemente « Lemma 
dei nove ». 

A pagina 20 del libro di Mitchell 
Theory of Categories troviamo il se¬ 
guente “diagramma commutativo” (non 
ha importanza la strada che si segue per 
andare da un posto all’altro seguendo il 
verso delle frecce): 
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0 0 0 


A' A A" 


0 -> B' -> B - >B" -> 0 


0 -> C' -s- C -s- C" —> 0 


0 0 0 

Supponiamo che tutte le righe e tutte 
le colonne siano successioni (o sequen¬ 
ze) esatte, cioè che il nucleo di ogni 
morfismo sia la immagine di quello che 
lo precede. Bene, in tali ipotesi e in una 
classe particolare, ma abbastanza va¬ 


sta, di categorie (le « categorie esatte ») 
il diagramma si può completare, in mo¬ 
do che resti commutativo, aggiungendo 
morfismi tra A' e A, e tra A e A", in 
modo che anche la nuova riga: 

0- >A' -» A-» A"->0 

risulti esatta. 

J>i leggo quanto ho scritto, e dispero 
che qualche non matematico sia ar¬ 
rivato in porto. Temo, perciò, di avere 
lavorato, tutt’al più, a beneficio di qual¬ 
che matematico buon conoscitore di in¬ 
siemi, gruppi, anelli, anche se non di 
categorie. 

Tuttavia il compito iniziale resta. E 
non si tratta di un lusso intellettuale, 
del desiderio di completezza culturale 
nell’uomo di scienza. No. Il fatto è, in¬ 
vece, che occorre fortemente accelerare 
i tempi di passaggio dalla cultura specia¬ 
listica alla cultura scientifica media (di 
massa) dei livelli di astrazione algebri¬ 


ca dei quali abbiamo discorso. È sem¬ 
brato già un successo, otto anni fa, in¬ 
trodurre le astrazioni di secondo grado 
(gruppi e anelli, soprattutto) al primo 
anno del corso di laurea in matematica. 
Ora i fisici si chiedono se quei con¬ 
cetti non debbano essere acquisiti an¬ 
che dagli studenti del primo anno di 
fisica. Oggi, leggendo quello che a mio 
avviso è il miglior manuale di algebra 
per un primo biennio di matematica, il 
volume di Mac Lane-Birkhoff, vedia¬ 
mo che esso è fondato sui concetti di 
categoria, di funtore, di soluzione (ele¬ 
mento) universale, che compaiono sin 
dalle prime pagine. 

La verità è che le astrazioni, più po¬ 
tenti sono, più sono semplici, e più so¬ 
no utili. Ogni passaggio a un nuovo li¬ 
vello di astrazione è la liberazione da 
una gran quantità di nozioni, di concet¬ 
ti particolari, perché astrazione è uni¬ 
ficazione, ed è chiarificazione. 
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Induzione e probabilità 

L’evoluzione del concetto di probabilità e la « crisi 
dei fondamenti » hanno strettamente legato la teoria 
della probabilità alla moderna logica induttiva 

di Domenico Costantini e Marco Mondadori 


S in dall’antichità è considerato 
compito della logica analizzare 
le nostre argomentazioni, cioè 
analizzare i ragionamenti mediante i 
quali a partire da certe premesse arri¬ 
viamo a certe conclusioni. Nel Medio¬ 
evo si individuarono due tipi di logica: 
la logica formale, o minore, e quella 
materiale, o maggiore. La prima avreb¬ 
be dovuto occuparsi di analizzare la 
correttezza delle argomentazioni pre¬ 
scindendo dai loro contenuti. La secon¬ 
da invece avrebbe dovuto consentire di 
stabilire le condizioni alle quali i ragio¬ 
namenti non solo sono corretti ma so¬ 
no anche veri, arrivano cioè alla scien¬ 
za « vera ». Dalla fine del secolo scor¬ 
so però la pretesa di costruire una lo¬ 
gica materiale è stata definitivamente 
abbandonata, almeno dalla maggior 
parte degli studiosi di logica, di guisa 
che ora per logica si intende solo la 
logica formale. 

Le nostre argomentazioni possono es¬ 
sere suddivise in due grandi tipi: da 
una parte quelle che prendono le mos¬ 
se da premesse vere o presunte tali e 
consentono di arrivare a conclusioni 
vere (inferenze dimostrative); dall’altra 
quelle che non possiedono questa ca¬ 
ratteristica, quelle cioè che non conser¬ 
vano la verità delle premesse nel senso 
che pur partendo da premesse vere o 
presunte tali non escludono la possibi¬ 
lità di pervenire a conclusioni false (in¬ 
ferenze non dimostrative). La discipli¬ 
na che studia a livello formale le infe¬ 
renze dimostrative è nota col nome di 
logica simbolica o matematica; siamo 
però convinti che sarebbe più opportu¬ 
no chiamarla logica deduttiva. Essa ri¬ 
sale sostanzialmente ad Aristotele, fu 
largamente studiata nel Medioevo e fu 
sempre nettamente distinta dalla logi¬ 
ca materiale. 

La disciplina che studia le inferenze 
non dimostrative è nota come logica 
induttiva. A differenza di quanto avven¬ 


ne per la logica deduttiva, la distinzio-, 
ne fra logica formale e materiale a li¬ 
vello delle inferenze non dimostrative 
non è stata affatto netta nel senso che 
la convinzione che anche la logica in¬ 
duttiva dovesse essere sviluppata come 
una disciplina formale si è affermata 
solo molto recentemente se si escludo¬ 
no le idee di G. W. Leibniz a questo ri¬ 
guardo, idee che però restarono del tut¬ 
to isolate. Infatti il termine « logica in¬ 
duttiva » è stato tradizionalmente usa¬ 
to per designare un insieme di ricerche 
e di dottrine che hanno la loro origi¬ 
ne in F. Bacone e raggiungono il loro 
massimo sviluppo con J. S. Mill. Nel¬ 
l’ambito di questa tradizione l’induzio¬ 
ne viene concepita, appunto da Mill, 
come un processo inferenziale median¬ 
te il quale « concludiamo che ciò che è 
vero di certi individui di una classe è 
vero per l’intera classe, o che ciò che 
è vero in certi tempi sarà vero, in cir¬ 
costanze simili, in tutti i tempi ». 

Ma, dato che per l’empirismo classico 1 ' 
lo scopo della scienza è la scoperta di 
leggi generali, ne consegue che la logi¬ 
ca induttiva è intesa da Bacone e Mill 
come la logica della scoperta scientifi¬ 
ca, cioè come lo studio e l’esplicitazio- 
ne dell’insieme di quei metodi che ci 
portano alla scoperta delle leggi scien¬ 
tifiche, in ultima analisi, come una lo¬ 
gica materiale. Ed è appunto in questo 
quadro che si collocano i famosi quat¬ 
tro metodi milliani della concordanza, 
della differenza, delle variazioni conco¬ 
mitanti e dei residui. 

Induzione e probabilità 

Questo modo di intendere il compito 
e la portata della logica induttiva fu 
universalmente accettato fino agli inizi 
del nostro secolo. Come abbiamo detto 
vi era però un modo alternativo di in¬ 
tendere la logica induttiva anche se es¬ 
so ha avuto a livello filosofico « ufficia¬ 


le » un’influenza oltremodo scarsa. Il 
primo rappresentante di questa ulterio¬ 
re concezione è - lo abbiamo già visto 
- Leibniz secondo il quale le leggi ge¬ 
nerali « non si scoprono mediante l’in¬ 
duzione dagli esempi »; mediante que¬ 
sta induzione possiamo semplicemente 
giungere ad assegnare un certo grado di 
probabilità a leggi generali già date. Se¬ 
condo Leibniz, quindi, la logica indut¬ 
tiva è una disciplina formale nel sen¬ 
so che non è suo compito scoprire le 
leggi di natura: essa deve limitarsi ad 
assegnare un grado di probabilità alle 
leggi di natura delle quali in qualche 
modo già disponiamo. 

Con Leibniz troviamo quindi la pri¬ 
ma intuizione del rapporto tra proba¬ 
bilità e induzione, rapporto che costi¬ 
tuisce il punto centrale delle moderne 
ricerche di logica induttiva. Dovette pe¬ 
rò passare quasi un secolo prima che la 
geniale intuizione leibniziana riuscisse 
ad assumere, per opera di P. S. La¬ 
place, la sua prima parziale formulazio¬ 
ne scientificamente corretta. Infatti, fu 
soltanto quando la teoria delle proba¬ 
bilità assunse una veste scientificamen¬ 
te soddisfacente - e ciò avvenne gra¬ 
zie all’opera del grande scienziato fran¬ 
cese - che fu possibile disporre di un 
quadro concettuale adeguato alla for¬ 
mulazione di una concezione della lo¬ 
gica induttiva come quella di Leibniz. 

Con Laplace viene operata la prima 
sistemazione rigorosa dei metodi con 
cui è possibile derivare, da probabilità 
date di ipotesi, probabilità di ipotesi lo¬ 
gicamente connesse con le prime, ipo¬ 
tesi in generale più complesse di quelle 
di partenza. Se, per esempio, conoscia¬ 
mo la probabilità dell’ipotesi A e quel¬ 
la dell’ipotesi B, e sappiamo che A e 
B sono incompatibili, la teoria delle 
probabilità ci dice che la probabilità 
dell’ipotesi « A oppure B » è uguale al¬ 
la somma della probabilità di A e di 
quella di B. La teoria delle probabilità 
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FACCE DEL DADO 

FREQUENZE RELATIVE 
PRIMA SERIE 

FREQUENZE RELATIVE 
SECONDA SERIE 

FREQUENZE RELATIVE 
TERZA SERIE 

1 

0,17 

0,18 

0,175 

2 

0,14 

0,13 

0,135 

3 

0,17 

0,15 

0,160 

4 

0,16 

0,19 

0,175 

5 

0,17 

0,18 

0,175 

6 

0,19 

0,17 

0,180 



ISTOGRAMMA 1 ISTOGRAMMA 2 



Nei due istogrammi a sinistra sono visualizzati i risultati di due 
serie di 100 lanci effettuati con un dado comperato in un super- 
mercato qualsiasi. Nel terzo istogramma è invece visualizzato il 


risultato delle due stesse serie di lanci considerate come un’unica 
serie di 200 lanci. Le frequenze relative della tabella in alto sono 
desunte rispettivamente dal primo, secondo e terzo istogramma. 


assolve infatti questo compito e, come 
è bene precisare fin d’ora, solo questo 
compito. Essa non ci dice infatti come 
debbano essere determinate le probabi¬ 
lità delle ipotesi di partenza; nell’esem¬ 
pio considerato, non ci dice come dob¬ 
biamo determinare la probabilità di A 
e quella di B. 

In realtà Laplace si era interessa¬ 
to anche alla determinazione delle pro¬ 
babilità mediante la sua famosa defini¬ 
zione del termine « probabilità » di cui 
ci occuperemo tra poco. Prima però di 
analizzare questa definizione è opportu¬ 
no ribadire un fatto che divenne chia¬ 
ro solo all’inizio del nostro secolo e al 
quale abbiamo già fatto cenno quando 
pocanzi abbiamo detto che la teoria 
delle probabilità consente solo di pas¬ 
sare da probabilità note a probabilità 
sconosciute legate alle prime. Questo 
fatto può essere espresso nel modo se¬ 
guente: la teoria delle probabilità non 
permette di individuare in modo univo¬ 


co il significato da attribuire al termi¬ 
ne « probabilità » né di formulare al¬ 
cuna indicazione sul modo con cui le 
probabilità delle ipotesi devono essere 
determinate. Questa caratteristica della 
teoria delle probabilità deve essere sem¬ 
pre tenuta presente perché si tratta di 
un problema la cui estrema importan¬ 
za diventa palese quando si pensi che, 
senza un modo per determinare i va¬ 
lori di probabilità delle ipotesi, non è 
possibile applicar? la teoria delle pro¬ 
babilità. 

Contrariamente a quanto potrebbe 
sembrare a prima vista, il dibattito 
sul significato da attribuire al termine 
« probabilità » non è circoscritto a co¬ 
loro che si occupano professionalmen¬ 
te della teoria delle probabilità. In una 
certa misura tale dibattito riguarda cia¬ 
scuno di noi quando, nel servirci di 
termini quali « probabilità », « probabi¬ 
le » e « probabilmente », ci chiediamo 
che cosa in realtà intendiamo dire; 


quasi certamente in casi del genere o 
non siamo stati in grado di trovare 
una risposta soddisfacente, oppure ci 
siamo accorti che la risposta da noi da¬ 
ta non era condivisa da altri. 

Chi di noi ha avuto l’occasione di ci¬ 
mentarsi con un gioco d’azzardo come 
la roulette oppure con un concorso a 
pronostici come il totocalcio - che re¬ 
sta comunque un gioco d’azzardo an¬ 
che se gestito dallo stato - si sarà cer¬ 
tamente chiesto, da una parte, che co¬ 
sa si intenda dire con raffermare che 
il rosso è tanto probabile quanto il ne¬ 
ro o che il banco ha maggiori proba¬ 
bilità di vincere rispetto al giocatore; 
d’altra parte, cosa si intenda quando si 
sostiene che probabilmente la squadra 
■A vincerà la partita che giocherà la do¬ 
menica seguente contro la squadra B. 

La risposta più immediata che si può 
dare nel caso della roulette è che il 
rosso è tanto probabile quanto il nero 
perché vi sono 18 numeri rossi e 18 
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Simbolo 

Significato 

~i 

non 

V 

o 

A 

e 

-> 

se ... allora 


se e solo se 

3 

esiste almeno un 

V 

per tutti 

a ,' a 2. A 

costanti individuali 

P P P 

' 1' ' 2’ r m 

costanti predicative 


Alcuni dei principali simboli, e relativo significato, appartenenti al linguaggio simbo¬ 
lico di cui si parla nell’articolo. Le costanti individuali denotano individui descritti dal 
linguaggio mentre le costanti predicative descrivono proprietà godute dagli individui. 


numeri neri e quindi i casi favorevoli 
al rosso sono tanti quanti quelli favo¬ 
revoli al nero. Parimenti la ragione per 
cui il banco ha maggior probabilità di 
vincere di quante non ne abbia il gio¬ 
catore va cercata nel fatto che que¬ 
st’ultimo puntando, per esempio, sui 
numeri pari ha soli 18 casi favorevoli 
mentre il banco ne ha 19, cioè 18 di¬ 
spari e lo 0. 

La risposta data da uno scommetito- 
re del totocalcio circa il significato da 
attribuire al termine « probabilmente » 
sarà sicuramente diversa. Essa infatti 
potrà essere che la squadra A vincerà 
probabilmente la partita della domenica 
seguente perché i tre migliori giocato¬ 
ri della squadra B sono stati squalifica¬ 
ti e quindi non potranno giocare; op¬ 
pure la risposta potrebbe anche essere 
che la squadra B sta attraversando un 
periodo di scarsa forma come è dimo¬ 
strato dal fatto che da cinque dome¬ 
niche non riesce a vincere una par¬ 
tita, ecc. 

È evidente che le due spiegazioni ora 
viste del termine « probabilità » sono 
diametralmente opposte. In un caso in¬ 
fatti si fa appello all’analisi dei casi 
favorevoli all’ipotesi che interessa, men¬ 
tre nell’altro si ricorre a certe infor¬ 
mazioni più o meno « soggettive » di 
cui il tifoso dispone. 

Le varie accezioni di « probabilità » 

La disparità di opinioni che abbiamo 
incontrato a livello del modo comune 
di parlare la ritroviamo anche a livel¬ 
lo scientifico, come vedremo subito 
esponendo le varie definizioni di proba¬ 
bilità che sono state proposte. Comin¬ 
ciamo questa esposizione dalla defini¬ 
zione classica di probabilità, definizio¬ 
ne dovuta, come abbiamo detto, a La¬ 
place. Il grande scienziato francese, 


quando per la prima volta introdusse 
esplicitamente una definizione di pro¬ 
babilità, argomentò in modo del tutto 
simile a quello del nostro giocatore di 
roulette. Ciò non deve meravigliare dal 
momento che la prima formulazione 
scientificamente accettabile della teoria 
delle probabilità operata da Laplace nei 
primi anni del secolo scorso costituiva 
la razionalizzazione di una serie di ri¬ 
sultati, relativi ai fenomeni casuali, che 
erano andati accumulandosi nel XVIII 
secolo e che per la maggior parte era¬ 
no relativi ai giochi d’azzardo. Co¬ 
me abbiamo visto nel nostro esem¬ 
pio della roulette, in questi casi è del 
tutto naturale legare la probabilità di 
un evento ai casi favorevoli all’evento 
stesso (parlare di probabilità di un’ipo¬ 
tesi o, come abbiamo fatto ora, di pro¬ 
babilità di un evento, non comporta al¬ 
cuna differenza sostanziale: si può in¬ 
fatti immediatamente passare dalle une 
alle altre prendendo in considerazione 
rispettivamente l’ipotesi che descrive 
l’evento e l’evento descritto dall’ipote¬ 
si). Gli scienziati che per primi nel 
XVIII secolo si interessarono a questi 
problemi, e Laplace che diede una siste¬ 
mazione rigorosa ai loro risultati, defi¬ 
niscono la probabilità di un evento co¬ 
me il rapporto fra il numero dei casi fa¬ 
vorevoli al verificarsi dell’evento stes¬ 
so e il numero dei casi possibili pur¬ 
ché questi ultimi siano tutti ugualmen¬ 
te possibili. 

Questa definizione di probabilità fu 
unanimemente accettata e, prescinden¬ 
do da qualche isolata voce discorde, fu 
la definizione adottata durante tutto il 
secolo scorso. Abbiamo però detto che 
qualche studioso, soprattutto nella se¬ 
conda metà del XIX secolo, non era 
affatto d’accordo con l’opinione più 
diffusa. Questi dissensi diventarono 
consistenti nei primi anni del nostro 


secolo e gli argomenti contrari alla de¬ 
finizione laplaciana possono essere rias¬ 
sunti nel modo seguente. 

L’applicazione di questa definizione 
dipende in modo essenziale dalla clau¬ 
sola secondo cui i casi possibili debbo¬ 
no essere tutti ugualmente possibili. Ma 
come facciamo a sapere che un dato 
insieme di casi possibili è un insieme 
di casi equipossibili? La risposta di La¬ 
place è la seguente: « La teoria della 
probabilità consiste nel ridurre tutti gli 
eventi di un certo tipo a un certo nu¬ 
mero di casi ugualmente possibili, cioè 
tali che possiamo essere ugualmente in¬ 
certi circa la loro esistenza ». La fra¬ 
se in corsivo è una delle possibili for¬ 
mulazioni di un famoso principio enun¬ 
ciato da J. Bernoulli sotto il 'nome di 
principio di ragione non sufficiente e 
ora noto invece come principio d’indif¬ 
ferenza. Per la maggior parte delle si¬ 
tuazioni induttive del tipo considerato 
per lo più da Laplace, risulta non so¬ 
lo abbastanza facile, ma anche abba¬ 
stanza naturale analizzare la situazio¬ 
ne in un insieme di casi equipossibili, 
tali cioè che non sussistano ragioni di 
credere che se ne verificherà uno di 
essi piuttosto che un altro (il lettore si 
sarà accorto che questa è un’altra for¬ 
mulazione del principio d’indifferenza). 
In effetti nei casi dei giochi d’azzardo 
che fanno uso di meccanismi non truc¬ 
cati (dadi, monete, roulette, urne) è 
molto plausibile l’ipotesi di equipossi- 
bilità dei casi possibili. Ma le difficoltà 
si presentano non appena abbiamo 
qualche ragione di sospettare che i da¬ 
di, le monete, le roulettes sono trucca¬ 
ti. Per esempio nel caso di un dado za¬ 
vorrato è ovvio che le uscite di ciascu¬ 
na delle sei facce non potranno piu es¬ 
sere considerate come equipossibili. A 
un’analisi più sottile la definizione di 
Laplace si rivela già inapplicabile, al¬ 
meno in senso generale, agli stessi casi 
per i quali era stata formulata. 

Al di fuori di questi casi l’inapplica¬ 
bilità di tale definizione è addirittura 
palese: che cosa significa infatti che il 
signor Rossi che ha compiuto 38 an¬ 
ni ha una probabilità pari a 0,003 di 
morire nel corso del 39° anno di vita? 
Significa forse che il nostro signore 
ha di fronte 1000 modi alternativi di 
vivere di cui solo 3 lo conducono a 
morte nel corso del prossimo anno? 
L’assurdità di una simile ipotesi è co¬ 
si evidente da non meritare alcun com¬ 
mento. 

Le critiche che abbiamo ricordato 
sono dovute a R. von Mises che le for¬ 
mulò attorno al 1920 e segnarono l’ini¬ 
zio del periodo ormai noto come « cri¬ 
si dei fondamenti della probabilità », 
cioè di quel periodo di dibattiti volti a 
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individuare una nuova spiegazione del 
significato del termine « probabilità » 
da sostituire a quella data da Laplace 
all’inizio del XIX secolo. 

Von Mises fece seguire alle critiche 
viste una nuova definizione di probabi¬ 
lità; serviamoci di un esempio per me¬ 
glio afferrare la innovazione contenuta 
nella definizione da lui proposta. Sup¬ 
poniamo di lanciare un certo nume¬ 
ro di volte un dado e di registrare i 
risultati dei nostri lanci nel seguente 
prospetto: 


1° 

2° 

3° 

4° 

5° 

6° 

7° 

6 

4 

2 

1 

6 

4 

2 

8° 

9° 

10° 

11° 

12° 

13° 


1 

3 

2 

3 

1 

1 



Chiamiamo ora frequenza relativa del¬ 
l’evento « uscita di 1 » il numero di 
volte in cui compare l’I in un certo 
numero di lanci diviso il numero di 
questi ultimi. Nel nostro esempio la 
frequenza relativa di questo evento sa¬ 
rà allora 4/13 mentre la frequenza re¬ 
lativa dell’evento « uscita di 6 » sarà 
2/13. Ciascun evento avrà una sua fre¬ 
quenza relativa che varierà col variare 
del numero di lanci che prendiamo in 
considerazione. La frequenza relativa 
dell’evento « uscita di 1 », quando ci li¬ 
mitiamo a considerare i primi sei lan¬ 
ci, sarà 1/6. 

Von Mises sostenne che per proba¬ 
bilità del verificarsi di un certo evento 
in una successione casuale di eventi si¬ 


mili e ripetibili, quali i lanci di un da¬ 
do del nostro esempio, doveva inten¬ 
dersi il limite al quale tende la frequen¬ 
za relativa di quell’evento quando il nu¬ 
mero dei termini della successione cre¬ 
sce indefinitamente, ovviamente quan¬ 
do questo limite esiste. È bene precisa¬ 
re che il termine « limite » usato in 
questo contesto non è il preciso con¬ 
cetto dell’analisi matematica bensì il 
concetto impreciso che ciascuno di noi 
usa quando nel linguaggio di tutti i 
giorni si serve di questo termine. 

All’incirca nello stesso periodo fu pe¬ 
rò proposta, a opera dell’economista J. 
M. Keynes, una terza definizione di 
probabilità. Per Keynes la probabilità 
di una ipotesi è una relazione logica 
che lega un insieme di informazioni di¬ 
sponibili per un certo individuo o per 
una certa collettività e l’ipotesi stessa. 
Questo autore non precisava tuttavia 
che cosa dovesse intendersi per questa 
relazione logica cosi che l’intera defi¬ 
nizione restava alquanto oscura. Si può 
dare un’idea di ciò che Keynes inten¬ 
deva facendo intervenire una relazione 
logica per spiegare il significato della 
probabilità, tornando all’esempio del ti¬ 
foso che riteneva probabile la vittoria 
della squadra A nella partita della do¬ 
menica seguente. Il nostro tifoso ritene¬ 
va infatti che esistesse qualche rela¬ 
zione oggettiva, e in questo senso lo¬ 
gica, tra la mancanza dei tre miglio¬ 
ri giocatori di B e il rendimento di 
questa squadra nella prossima partita, 
oppure che lo stato di scarsa forma di¬ 
mostrato dalla squadra B nelle ultime 
cinque partite fosse in qualche modo 
oggettivamente connesso con il com¬ 


portamento di questa squadra nella 
prossima partita con la squadra A. In 
breve, il nostro tifoso riteneva che la 
vittoria della squadra A fosse probabi¬ 
le perché un insieme di informazioni 
in suo possesso sostenevano l’ipotesi 
della vittoria di A più di quanto so¬ 
stenessero l’ipotesi contraria. 

Alcuni anni più tardi, attorno al 
1930, due autori, l’inglese F. P. Ram¬ 
sey e l’italiano B. de Finetti, pur par¬ 
tendo da considerazioni del tutto diffe¬ 
renti, arrivarono a una medesima con¬ 
clusione relativamente al significato da 
attribuire al termine « probabilità », 
conclusione del tutto diversa da quel¬ 
la alla quale erano arrivati i due auto¬ 
ri che abbiamo già preso in esame. 
Ramsey infatti, dopo aver tentato sen¬ 
za successo di dare un significato alla 
relazione logica che compare nella de¬ 
finizione di Keynes, si convinse che 
l’unica possibilità di legare fra di loro 
le informazioni in possesso di un indi¬ 
viduo e una ipotesi da questi avanza¬ 
ta, consisteva nel fare appello alla fi¬ 
ducia che l’individuo nutriva nella veri¬ 
tà della ipotesi in questione. De Finet¬ 
ti invece, muovendo dalla convinzio¬ 
ne che ogni evento è un fatto unico 
non ripetibile e che, conseguentemente, 
non ha senso ipotizzare la ripetibilità 
degli eventi come presuppone la defi¬ 
nizione di von Mises, arrivò come Ram¬ 
sey a sostenere che la probabilità di 
un evento è la fiducia che un dato in¬ 
dividuo nutre nel verificarsi dell’evento 
stesso. 

Una conseguenza immediata di que¬ 
sti contrastanti punti di vista era che 
ciascuno di essi proponeva un modo, 
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Rappresentazione simbolica degli assiomi della logica induttiva 
di cui si parla nell’articolo, c (H, E) significa la probabilità di 
H sulla base di E; nei casi interessanti l’enunciato H descrive 
un’ipotesi relativa a un fatto sconosciuto mentre l’enunciato E de¬ 
scrive un insieme di risultati sperimentali conosciuti da chi for¬ 


mula l’ipotesi. Il simbolo I— serve per indicare che quanto lo se¬ 
gue è dimostrabile, e quindi t- H < — > H' significa che H e H' so¬ 
no logicamente equivalenti, q, r e t sono permutazioni rispettiva¬ 
mente delle costanti individuali, delle costanti predicative e delle 
famiglie con lo stesso numero di membri del linguaggio simbolico. 



















diverso da quello proposto dagli altri, 
di determinare le probabilità. Per i fre- 
quentisti, cioè per coloro che accetta¬ 
no la definizione di von Mises, la pro¬ 
babilità deve essere determinata sulla 
base di osservazioni sperimentali, cioè 
esaminando le frequenze relative con 
cui gli eventi si verificano. Per i logi- 
cisti, cioè per coloro che accettano la 
tesi di Keynes, la probabilità deve es¬ 
sere determinata cercando di dare un 
valóre numerico alla relazione logica 
che lega le conoscenze di cui si dispo¬ 
ne e l’ipotesi che descrive il verificar¬ 
si dell’evento. Per i soggettivisti infine, 
cioè per coloro che fanno proprie le 
argomentazioni di Ramsey e de Finet¬ 
ti, le probabilità devono essere deter¬ 
minate rendendo esplicita mediante 
l’uso di scommesse la fiducia degli in¬ 
dividui nel verificarsi dell’evento. È 
chiaro che, mentre per i frequentisti e 
i logistici vi è una sola probabilità 
per ogni evento, nel senso che la pro¬ 
babilità è un fatto esterno all’uomo 
che questo deve scoprire, per i sogget¬ 
tivisti invece ogni uomo può assegna¬ 
re a un dato evento una sua propria 
probabilità e il fatto che due individui 
possano avere la stessa fiducia nel ve¬ 
rificarsi di un evento e quindi assegnar¬ 
gli la stessa probabilità, è un fatto del 
tutto accidentale. 

L’assiomatizzazione di Kolmogorov 

All’inizio degli anni trenta le cose 
stavano quindi come abbiamo visto: 
esistevano cioè tre modi contrapposti di 
definire la probabilità, e di conseguen¬ 
za tre modi diversi di determinare la 
probabilità; ma ancora, ciò che è sen¬ 
za dubbio più grave, si credeva che esi¬ 
stessero tre teorie diverse delle proba¬ 
bilità poiché ciascuno degli indirizzi che 
abbiamo passato in rassegna sosteneva 
che la teoria delle probabilità era quel¬ 
la sviluppata a partire dalla definizione 
che esso sosteneva, cioè era rispettiva¬ 
mente la teoria delle successioni casua¬ 
li di eventi, delle relazioni logiche tra 
evidenze e ipotesi e della fiducia degli 
individui nel verificarsi degli eventi. 

La crisi dei fondamenti della proba¬ 
bilità si rifletteva quindi sulla stessa 
teoria delle probabilità con evidente 
grave pregiudizio di quest’ultima. Que¬ 
sto stato di incertezza fu però supera¬ 
to nel 1933 quando il matematico so¬ 
vietico A. N. Kolmogorov dimostrò 
che la teoria delle probabilità poteva 
essere completamente sviluppata senza 
mai farvi intervenire il significato del 
termine « probabilità ». In altre parole, 
il matematico sovietico mostrò che la 
teoria delle probabilità - come del re¬ 
sto tutta la matematica di cui questa 


teoria è una branca - si occupa di en¬ 
tità astratte che non necessitano, alme¬ 
no a livello dello sviluppo della teoria, 
di alcuna interpretazione. Kolmogorov 
si poneva cioè sulle orme di D. Hilbert, 
e, come quest’ultimo aveva mostrato 
che l’intera geometria poteva essere svi¬ 
luppata senza fare riferimento al signi¬ 
ficato dei termini « punto », « retta », 
« piano », ecc., cosi Kolmogorov mostrò 
che l’intera teoria delle probabilità può 
essere sviluppata senza fare riferimento 
al significato del termine « probabili¬ 
tà », limitandosi a introdurre assioma¬ 
ticamente alcune sue caratteristiche, 
per altro molto generali, note appunto 
come assiomi della teoria delle proba¬ 
bilità: a) la probabilità è una funzione 
i cui argomenti sono eventi (ipotesi) e 
i cui valori sono numeri reali maggiori 
o uguali a zero e minori o uguali a 
uno; b) la probabilità di due eventi 
(ipotesi) che non possono verificarsi 
contemporaneamente (che sono incom¬ 
patibili) è la somma delle probabilità 
dei due eventi (ipotesi). 

L’opera di Kolmogorov ebbe una 
importanza notevolissima innanzitutto 
perché, liberando la teoria delle proba¬ 
bilità dalle dispute relative ai fonda¬ 
menti, le permise uno sviluppo indipen¬ 
dente e rigoglioso tanto che oggi que¬ 
sta disciplina rappresenta una delle 
branche della matematica più attive e 
feconde di risultati. Tuttavia l’influen¬ 
za del fondamentale lavoro del mate¬ 
matico sovietico non restò limitata a 
ciò: la generalizzazione dell’istanza di 
fondo che caratterizza il lavoro di Kol¬ 
mogorov avrebbe infatti portato a una 
svolta radicale nella crisi dei fonda¬ 
menti della probabilità, cioè alla nasci¬ 
ta della logica induttiva moderna. 

Abbiamo detto che la tesi di fondo 
su cui si basa il lavoro del matematico 
sovietico è la seguente: la teoria delle 
probabilità può e deve essere sviluppa¬ 
ta senza fare riferimento al significato 
del termine « probabilità ». Vediamo 
ora cosa significhi generalizzare questa 
tesi. È chiaro che, prescindendo dalle 
intenzioni sostanzialmente metafisiche 
volte a individuare l’essenza della pro¬ 
babilità, intenzioni che ora non ci in¬ 
teressa analizzare, il significato delle ri¬ 
cerche connesse con la crisi dei fon¬ 
damenti della probabilità risiede nella 
convinzione che solo quando si è at¬ 
tribuito un significato al termine « pro¬ 
babilità » si possano determinare i va¬ 
lori di probabilità e quindi in ultima 
istanza si possa applicare la teoria delle 
probabilità. È ora naturale, accettando 
la istanza formalistica di Kolmogorov, 
porsi la seguente domanda: se è pos¬ 
sibile sviluppare la teoria delle proba¬ 
bilità senza fare appello al significato 


del termine « probabilità », non sarà 
possibile trovare il modo di determinare 
anche i valori di probabilità senza fare 
riferimento al significato di questo ter¬ 
mine? Se si generalizza l’impostazione 
formalistica di Kolmogorov, non si può 
non dare risposta affermativa a questa 
domanda; ciò significa tentare di elabo¬ 
rare dei metodi atti alla determinazio¬ 
ne delle probabilità nei quali non si 
faccia alcun riferimento a un qualun¬ 
que significato di « probabilità ». La do¬ 
manda successiva sarà allora come ciò 
sia possibile. La nostra risposta è che 
le probabilità vengono di fatto deter¬ 
minate - in generale ma non necessa¬ 
riamente - mediante i cosiddetti me¬ 
todi statistici. Esempi di questa deter¬ 
minazione si hanno nelle ricerche fisi¬ 
che, astronomiche, economiche, demo¬ 
grafiche, genetiche, farmacologiche, 
meteorologiche e in molte altre disci¬ 
pline, in sostanza in tutte le discipli¬ 
ne sperimentali. 

La logica induttiva 

Le ricerche relative ai fondamenti 
della probabilità acquistano quindi un 
significato nuovo e completamente di¬ 
verso da quello che hanno avuto nella 
prima metà del secolo: non si tratterà 
più di andare alla ricerca di esplica¬ 
zioni del termine « probabilità » bensì' 
dei principi che di fatto regolano la 
determinazione delle probabilità nelle 
scienze sperimentali. Una volta che 
questi principi siano stati individuati, 
dovranno essere formalizzati e, sulla 
base di questa formalizzazione, se ne 
dovrà studiare la portata, la compatibi¬ 
lità reciproca, l’indipendenza reciproca 
e cosi di seguito; se ne dovrà cioè ana¬ 
lizzare la struttura logica e le implica¬ 
zioni epistemologiche. 

Alcuni di questi principi sono già 
stati individuati e dopo essere stati for¬ 
malizzati sono stati assunti quali assio¬ 
mi della logica induttiva; ora ne esa¬ 
mineremo alcuni fra i più importanti. 
La logica induttiva costituisce un am¬ 
pliamento della teoria delle probabilità; 
come abbiamo detto, quest’ultima può 
a pieno diritto essere considerata una 
parte della logica induttiva. Gli assio¬ 
mi di questa disciplina comprenderan¬ 
no quindi anche quelli della teoria del¬ 
le probabilità; ciò significa che una vol¬ 
ta determinati i valori di probabilità 
delle ipotesi induttive, essi possono es¬ 
sere « maneggiati » con i teoremi della 
teoria delle probabilità. 

Abbiamo visto che Kolmogorov basò 
il suo sistema d’assiomi sul presuppo¬ 
sto che la probabilità fosse una funzio¬ 
ne: ciò ci assicura l’esistenza di uno e 
un solo valore di probabilità in corri- 
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spondenza di ogni ipotesi. Sia quindi p 
la funzione-probabilità; essa avrà come 
argomenti enunciati (ipotesi) di un cer¬ 
to linguaggio simbolico e come valori 
numeri reali non negativi. Se fi è un 
enunciato, indicheremo con p ( H ) (a 
volte anche con p H ) il valore che la 
funzione-probabilità assume in corri¬ 
spondenza di H (la probabilità di H). 

Siano H e H' enunciati, imponiamo 
allora che la probabilità soddisfi le se¬ 
guenti condizioni: 

assioma dell’equivalenza: se H è 
logicamente equivalente a H', allora 
P (H) = p (H')\ 

assioma del limite superiore: se H 
è logicamente certo, allora p (H) = 1; 

assioma dell’additività: se H e H' 
sono logicamente incompatibili, allora 
p(HV H') = p (H) + p ( H '). 

Ci limiteremo a illustrare l’assioma 
dell’equivalenza poiché, come il letto¬ 
re avrà certamente notato, degli altri 
due ci siamo già occupati esaminando 
l’assiomatizzazione di Kolmogorov. Il 
lettore si sarà inoltre accorto che tra 
gli assiomi allora visti non compariva 
quello dell’equivalenza; ciò dipende dal 
fatto che Kolmogorov costruisce il suo 
sistema assiomatico sulla nozione di 
« evento » e non su quella di « enun¬ 
ciato » come noi stiamo facendo, e que¬ 
sto ci impone di prendere delle precau¬ 
zioni in vista di evitare spiacevoli con¬ 
seguenze. L’assioma dell’equivalenza 
afferma infatti che ipotesi logicamente 
equivalenti non possono avere probabi¬ 
lità diverse; in questo^ modo evitiamo 
l’eventualità senza dubbio spiacevole di 
assegnare probabilità diverse a ipotesi 
con lo stesso contenuto informativo, a 
ipotesi cioè che « dicono la stessa co¬ 
sa » seppure in modi diversi. 

Dopo aver esaminato gli assiomi del¬ 
la teoria delle probabilità passiamo a 
un assioma che sta per cosi dire a mez¬ 
za strada fra la teoria delle probabilità 
e la logica induttiva. Si tratta cioè di 
un assioma la cui validità alcuni riten¬ 
gono debba essere confinata alla logica 
induttiva mentre altri vorrebbero esten¬ 
dere anche alla teoria delle probabili¬ 
tà. Esso fu introdotto dai logici indut¬ 
tivi ma le ricerche di cui è stato og¬ 
getto hanno consentito di metterne in 
luce aspetti indubbiamente probabilisti¬ 
ci. Ma passiamo all’enunciazione del- 
Vassioma di regolarità: se p (H) = 1, 
allora H è logicamente certo. Questo 
assioma è indubbiamente legato a quel¬ 
lo del limite superiore: questo ci assi¬ 
cura che la probabilità delle ipotesi 
certe è pari a uno, quello di regolari¬ 
tà che vale anche l’inverso. La loro 
congiunzione porta a questa conclusio¬ 
ne: le ipotesi certe sono tutte e sole 
quelle la cui probabilità è pari a uno. 


Ma passiamo alla logica induttiva in 
senso proprio concentrando la nostra 
attenzione su alcuni fra i più caratte¬ 
ristici assiomi di questa disciplina. In¬ 
tendiamo riferirci agli assiomi dell’in- 
varianza, che per certi aspetti si ricol¬ 
legano al principio d’indifferenza di 
Bernoulli, e all’assioma di rilevanza de¬ 
gli esempi positivi. 

Gli assiomi dell’invarianza sono lar¬ 
gamene accettati dalla metodologia sta¬ 
tistica e possono trovare una matrice 
comune nel principio secondo cui, in 
alcune circostanze, quello che ha im¬ 
portanza nella valutazione delle proba¬ 
bilità è la quantità delle osservazioni e 
non anche la loro qualità. Ma cerchia¬ 
mo di chiarire questa affermazione con 
alcuni semplici esempi. Come è d’uso 
in questi casi, supponiamo di voler de¬ 
terminare la probabilità di estrarre una 
pallina di un dato colore da un’ur¬ 
na che sappiamo contenerne di bianche 
e di nere in proporzione sconosciuta. 
Supponiamo inoltre di operare la de¬ 
terminazione dopo aver fatto un certo 
numero di estrazioni, cioè di valutare 
la probabilità di un’estrazione futura 
sulla scorta della conoscenza dei risul¬ 
tati di alcune estrazioni passate. Ovvia¬ 
mente l’esempio di cui ci serviremo può 
essere facilmente generalizzato sia al 
caso in cui i colori delle palline con¬ 
tenute nell’urna siano più di due sia 
al caso in cui si tratti di esaminare in¬ 
dividui provenienti da una popolazione 
qualsiasi. 

Supponiamo quindi di aver estratto 
n palline dall’urna e di aver costatato 
che n B sono bianche e le restanti n H 
sono nere. Il nostro problema sarà al¬ 
lora di determinare la probabilità di 
estrarre al prossimo colpo una pallina 
bianca o, ciò che sostanzialmente è lo 
stesso, di determinare la probabilità 
dell’ipotesi secondo cui la prossima pal¬ 
lina che estrarremo sarà bianca. Sup¬ 
poniamo di averlo risolto in qualche 
modo cioè usando un metodo che però 
ora non ci interessa analizzare. In pri¬ 
ma istanza l’assioma dell’invarianza che 
per primo prenderemo in esame affer¬ 
ma che questa probabilità dipende uni¬ 
camente da n B e n N e non anche dal¬ 
l’ordine con cui le palline bianche e 
nere si sono presentate nel corso del¬ 
le n estrazioni già eseguite. Se cioè 
n B = 2 e n N — 1, le tre estrazioni che 
possono aver dato luogo a questo risul¬ 
tato sono ovviamente le seguenti: 

a) Ba,Ba 2 Na 3 

b) Ba 3 Na 2 Ba 3 

c) Na I Ba 2 Ba 3 

in cui B e N stanno per bianca e ne¬ 
ra e a h a 2 e a 3 indicano rispettivamen¬ 
te il risultato della (la pallina estratta 
alla) prima, seconda e terza estrazione. 


Indichiamo con p Ba , p Bb e p Bc le pro¬ 
babilità di estrarre al prossimo colpo 
una pallina bianca calcolata supponen¬ 
do noti rispettivamente i risultati a), 
b) e c). L’assioma in questione stabi¬ 
lisce che 

PBa = PBb = Pbc’ 

questa probabilità la indicheremo con 

fis¬ 
se ora formalizziamo il nostro di¬ 
scorso traducendo a), b ) e c ) in un op¬ 
portuno linguaggio simbolico, B e N 
diventeranno segni per proprietà (co¬ 
stanti predicative) e a,, a 2 e a 3 segni 
per individui (costanti individuali). In 
questo caso l’assioma di cui ci stiamo 
occupando diventa l’assioma dell’inva¬ 
rianza relativamente alle costanti indi¬ 
viduali: la probabilità di un enunciato 
è invariante relativamente alla permu¬ 
tazione delle costanti individuali del 
linguaggio. Infatti i tre risultati speri¬ 
mentali visti e anche gli enunciati che 
nel linguaggio simbolico li descrivono, 
si ottengono l’uno dall’altro permutan¬ 
do opportunamente gli individui (le co¬ 
stanti individuali). Una diversa formu¬ 
lazione di questo assioma, che può es¬ 
sere più convincente a livello intuitivo, 
è la seguente: nel valutare le probabi¬ 
lità tutti gli individui (le costanti indi¬ 
viduali) devono essere trattati alla pari. 

Prima di passare al secondo e al ter¬ 
zo assioma deH’invarianza, introducia¬ 
mo il concetto di famiglia di proprie¬ 
tà (costanti predicative); per famiglia 
intenderemo un insieme di proprietà 
(costanti predicative) a due a due in¬ 
compatibili e tali che ogni individuo 
(costante individuale) deve godere di 
almeno una di esse. Le proprietà coin¬ 
volte nelle estrazioni che abbiamo fino¬ 
ra preso in considerazione danno ori¬ 
gine a una famiglia; infatti una palli¬ 
na non può essere bianca e nera e ogni 
pallina che estraiamo gode di una del¬ 
le due proprietà, questo ovviamente 
per il modo con cui abbiamo costruito 
il dispositivo sperimentale. Anche le 
proprietà « essere testa » ed « essere 
croce » riferite ai possibili risultati del 
lancio di una moneta sono una fami¬ 
glia. Infatti lanciando una moneta non 
possono presentarsi contemporanea¬ 
mente due facce e d’altra parte una 
delle due facce deve presentarsi, ovvia¬ 
mente quando si escluda che la mone¬ 
ta possa fermarsi in bilico sullo spigo¬ 
lo. Ci si convince facilmente che an¬ 
che le date di nascita degli individui e 
il luogo in cui si trovano in un certo 
istante sono famiglie cosi come le loro 
stature^ i loro perimetri toracici e cosi 
di seguito. 

Supponiamo ora d’aver fatto una 
nuova serie di estrazioni tali che n B = 1 
e n N = 2. Come sappiamo le tre estra- 
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zioni che possono aver dato luogo a 
questo risultato sono le seguenti: 

d) Na I Na 2 Ba 3 

e) Na I Ba 2 Na 3 

f) Ba I Na 2 Na 3 

in cui i simboli hanno il significato che 
conosciamo. Supponiamo ora di essere 
in grado di determinare le probabilità 
che la pallina estratta al prossimo col¬ 
po sia nera sulla base della conoscen¬ 
za di d), e) e /) e inoltre che esse siano 
PNd = PNe = Puf- 

Quest’ultima uguaglianza vale ovvia¬ 
mente in virtù dell’assioma dell’inva¬ 
rianza relativamente alle costanti in¬ 
dividuali; indichiamo questa probabilità 
con p N . Il secondo assioma dell’inva¬ 
rianza stabilisce che 

Pn = Pb* 

cioè che la probabilità di estrarre una 
pallina nera, quando si sappia che so¬ 
no state estratte due palline nere e una 
bianca, deve essere uguale alla proba¬ 
bilità di estrarre una pallina bianca, 
quando si sappia che sono state estrat¬ 
te due palline bianche ed una nera. 
Generalizzato e tradotto a livello sim¬ 
bolico esso diventa l’assioma dell’inva¬ 
rianza relativamente alle costanti pre¬ 
dicative: la probabilità di un enuncia¬ 
to è invariante relativamente alla per¬ 
mutazione delle costanti predicative di 
una famiglia. Anzi, in questo caso vi 
è un’altra formulazione: nel valutare 
le probabilità tutte le proprietà (costan¬ 
ti predicative) di una famiglia devono 
essere trattate alla pari. 

Prendiamo ora in considerazione, ol¬ 
tre a quello delle urne, un nuovo espe¬ 
rimento, supponiamo cioè di aver lan¬ 
ciato tre volte una moneta senza cono¬ 
scere se la stessa è truccata oppure 
no, e di aver osservato che due volte 
si è presentata la faccia con la cro¬ 
ce e una volta quella con la testa, 
cioè n c = 2 e n T = 1. Supponiamo inol¬ 
tre di essere in grado di valutare la 
probabilità che nel prossimo lancio si 
presenti la faccia con la croce e che 
essa sia pari a p c . Se applichiamo il 
principio che finora ci ha guidato do¬ 
vremo concludere che, pur essendo il 
lancio di una moneta e l’estrazione dal¬ 
l’urna esperimenti che coinvolgono pro¬ 
prietà diverse, debba valere 
Pc = Pb 

in virtù del fatto che sia nell’uno sia 
nell’altro caso i risultati favorevoli al¬ 
l’ipotesi erano due e quello contrario 
uno. L’assioma che ha diretto le no¬ 
stre considerazioni è l’assioma dell’in¬ 
varianza relativamente alle famiglie : 
la probabilità di un enunciato è inva¬ 
riante relativamente alla permutazione 
delle famiglie del linguaggio con lo 
stesso numero di membri. 

L’ultimo assioma della logica indut¬ 


tiva che intendiamo prendere in esame, 
traduce a livello formale un principio 
che non solo è largamente usato in tut¬ 
te le elaborazioni statistiche dei dati 
sperimentali, ma è anche una delle te¬ 
si fondamentali deH’empirismo: si trat¬ 
ta del principio secondo cui dobbiamo 
imparare dall’esperienza. 

Si supponga di aver compiuto n estra¬ 
zioni da un’urna di cui al solito non 
conosciamo la composizione. Delle n 
estrazioni effettuate n B sono state pal¬ 
line bianche. Supponiamo ancora di di¬ 
sporre di un metodo che ci consenta 
la determinazione delle probabilità e 
che grazie a questo si sia calcolata pa¬ 
ri a p B la probabilità di ottenere una 
pallina bianca nella prossima estrazio¬ 
ne. Questa probabilità tiene ovviamen¬ 
te conto delle estrazioni effettuate. Sup¬ 
poniamo ora che la situazione speri¬ 
mentale sia leggermente mutata nel 
senso che delle n estrazioni fatte non 
più n B siano palline bianche bensì n B + 
+ 1; ciò significa che nella nuova si¬ 
tuazione sperimentale avremo estratto 
una pallina bianca in più rispetto alla 
situazione presa precedentemente in 
esame. Sulla base di questo mutato ri¬ 
sultato sperimentale calcoliamo, serven¬ 
doci del metodo di cui disponiamo, la 
probabilità di estrarre una pallina bian¬ 
ca e sia 'p B questa probabilità. L’assio¬ 
ma della rilevanza degli esempi positi¬ 
vi impone che qualunque sia il metodo 
usato per determinare p B e ’p B debba 
valere 

Pb < Pb ! 

cioè: la probabilità di un’ipotesi “deve 
crescere col crescere del numero degli 
individui osservati che verificano l’ipo¬ 
tesi stessa. 

Con questo assioma abbiamo conclu¬ 
so il nostro esame della logica indutti¬ 
va; ricordiamo però ancora una volta 
che gli assiomi di cui ci siamo occupa¬ 
ti sono solo una parte di quelli che 
stannò alla base dei sistemi finora no¬ 
ti di logica induttiva. Ci siamo infatti 
limitati ad alcuni assiomi che ci sono 
sembrati particolarmente adatti a cor¬ 
roborare le nostre affermazioni sulla 
natura e gli scopi della logica indutti¬ 
va moderna. Siamo inoltre convinti che 
questo esame sia servito a dare la mi¬ 
sura di quanto queste moderne ricerche 
si riallaccino a quelle che, secondo 
Leibniz, avrebbero dovuto costituire 
l’oggetto della logica induttiva. 

Indipendentemente comunque dal ri¬ 
collegarsi o meno alle intuizioni leib- 
niziane, la disciplina di cui abbiamo ora 
visto alcuni assiomi merita bene il no¬ 
me di logica induttiva che le abbiamo 
dato. Infatti, mentre la logica dedutti¬ 
va si occupa della struttura logica delle 
inferenze dimostrative, la logica indut¬ 


tiva si occupa con gli stessi intenti del¬ 
le inferenze non dimostrative, cioè 
della esplicitazione e dell’analisi delle 
modalità d’assegnazione delle probabili¬ 
tà alle ipotesi induttive. La logica in¬ 
duttiva moderna può quindi a pieno di¬ 
ritto essere inclusa nell’ambito della lo¬ 
gica formale. 

L’opera di Carnap 

Abbiamo detto all’inizio del presente 
articolo che è solo nei primi anni del 
nostro secolo che la logica induttiva ac¬ 
quista il suo significato moderno e ab¬ 
bandona definitivamente ogni pretesa 
di porsi come la logica della scoperta 
scientifica. Questa affermazione, sulla 
base di quanto abbiamo visto, deve pe¬ 
rò essere ridimensionata nel senso che 
è all’inizio del nostro secolo che matu¬ 
ra la crisi dei fondamenti della proba¬ 
bilità, crisi che sfocerà nella nascita 
della moderna logica induttiva. In sen¬ 
so lato, quindi, questa disciplina può 
farsi risalire all’inizio del nostro seco¬ 
lo solo se si intende - e questa è la 
nostra opinione - come la naturale con¬ 
seguenza e il superamento della crisi 
dei fondamenti della probabilità. In 
senso stretto, cioè come analisi razio¬ 
nale delle modalità di assegnazione del¬ 
le probabilità alle ipotesi induttive, es¬ 
sa è il risultato di ricerche portate 
avanti negli ultimi venti anni principal¬ 
mente per opera del filosofo della scien¬ 
za tedesco R. Carnap. 

La logica induttiva quindi è una di¬ 
sciplina molto giovane ed è naturale 
che stia muovendo i suoi primi pas¬ 
si fra difficoltà d’ogni genere. Ciò no¬ 
nostante ha già al suo attivo alcu¬ 
ni risultati notevoli, per esempio la di¬ 
mostrazione della non indipendenza 
dell’assioma di rilevanza degli esempi 
positivi e la dimostrazione di un cer¬ 
to tipo di incompatibilità tra l’assioma 
di invarianza relativamente alle fami¬ 
glie e gli altri assiomi. In questa sede 
non possiamo occuparci della non indi- 
pendenza dell’assioma della rilevanza a 
ragione delle difficoltà tecniche che 
comporta la sua dimostrazione. Il se¬ 
condo problema può invece essere af¬ 
frontato, almeno fino a un certo pun¬ 
to, senza fare ricorso ad alcun tecni¬ 
cismo. Abbiamo parlato di « un certo 
tipo » di incompatibilità perché non si 
è dimostrato che da questo assioma, in¬ 
sieme con gli altri della logica indut¬ 
tiva, si può derivare una contraddizio¬ 
ne, ma piuttosto che la sua accettazio¬ 
ne conduce a un risultato intuitivamen¬ 
te paradossale che può essere evitato se 
si lascia cadere l’assioma o se ne limi¬ 
ta la portata. 

Il paradosso della conferma, questo 
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è il nome con cui è noto questo risul¬ 
tato paradossale, può essere formulato 
nel modo seguente. È opinione comu¬ 
ne che se uno scienziato avanzasse la 
ipotesi «Tutte le pietre di Marte sono 
sferiche », ipotesi che indicheremo con 
H, egli dovrebbe, in vista di aumenta¬ 
re il grado di probabilità dell’ipotesi 
stessa (per confermarla), osservare le 
pietre di Marte e costatare che sono 
sferiche. Sarà cioè necessario che il 
nostro scienziato si ponga in grado di 
osservare le pietre di quel pianeta al¬ 
lo scopo di vedere se sono effettiva¬ 
mente sferiche. In altri termini, in ac¬ 
cordo con l’assioma della rilevanza, per 
confermare l’ipotesi H sarà necessario 
osservare oggetti che siano contempo¬ 
raneamente pietre di Marte e sferici. 
Ora se ci rammentiamo l’assioma del¬ 
l’equivalenza giungiamo al paradosso. 

L’ipotesi H è logicamente equivalen¬ 
te alla seguente « Tutti gli oggetti non 
sferici non sono pietre di Marte » che 
indicheremo con H'. Questa ipotesi è 
confermata dall’osservazione di oggetti 
che non sono né sferici né pietre di 
Marte, per esempio, un autocarro di 
Pavia o un tram di Milano. Ma H è 
logicamente equivalente a H' e quindi, 
per l’assioma dell’equivalenza, la pro¬ 
babilità di H deve essere uguale a quel¬ 
la di H’\ ne consegue che crescendo la 
probabilità di H' deve crescere anche 
quella di H, in definitiva che l’osserva¬ 
zione di autocarri di Pavia o tram di 
Milano conferma l’ipotesi che tutte le 
pietre di Marte sono sferiche. Quindi, 
per aumentare il grado di probabilità 
dell’ipotesi relativa alla forma delle pie¬ 
tre di Marte, lo scienziato che l’ha for¬ 
mulata dovrebbe mettersi alla ricerca 
di oggetti non sferici per vedere se so¬ 
no o no pietre di Marte. Per confer¬ 
mare la sua ipotesi il nostro scienziato 
non dovrebbe recarsi su Marte o nelle 
sue vicinanze perché gli basterebbe con¬ 
trollare che nella sua città esistono un 
gran numero di oggetti che non sono 
sferici. Una conferma di questo tipo 
è indubbiamente inaccettabile, d’altra 
parte è una conseguenza degli assiomi 
della logica induttiva: da qui il para¬ 
dosso. 

A prima vista il paradosso della con¬ 
ferma sembra destinato a infrangere 
ogni sforzo volto a costruire la logica 
induttiva intesa come analisi razionale 
delle inferenze non dimostrative. Tut¬ 
tavia lo studio approfondito che ne è 
stato fatto ha reso un grande servizio 
a questa disciplina poiché ha reso i suoi 
cultori molto più consapevoli di quan¬ 
to vanno facendo aumentando pertan¬ 
to l’efficacia delle loro ricerche. E ve¬ 
diamone le ragioni. 


Appena si scopre un paradosso subi¬ 
to si cerca la sua « soluzione » e im¬ 
maginiamo che anche il lettore sarà cu¬ 
rioso di sapere quale « soluzione » è 
stata data al paradosso della conferma, 
forse per confrontarla con quella che 
ha trovato per conto suo. Come inse¬ 
gna però la storia della logica, ogni pa¬ 
radosso trova sempre più di una solu¬ 
zione e in una certa misura non ne 
trova mai perché ogni « soluzione » af¬ 
fronta il paradosso secondo un ben de¬ 
terminato punto di vista. Nel nostro ca¬ 
so purtroppo non possiamo presentare 
le « soluzioni » finora suggerite, in pri¬ 
mo luogo, perché gli studi a esse lega¬ 
ti sono ben lungi dall’essere conclusi; 
in secondo luogo, perché la parziali so¬ 
luzioni finora trovate presuppongono 
un apparato tecnico che è fuor di luo¬ 
go ora presentare. Una direzione di ri¬ 
cerca sembra però un fatto ormai ac¬ 
quisito e può essere esposta senza fare 
ricorso ad alcun tecnicismo. Si è cioè 
scoperto che il paradosso della confer¬ 
ma trova origine nell’aver messo sullo 
stesso piano le due famiglie di cui fan¬ 
no parte rispettivamente le proprietà 
« essere una pietra di Marte » e « esse¬ 
re sferico ». Il paradosso potrà quindi 
risolversi se questa parità sarà lasciata 
cadere; ciò significa che se si vuole evi¬ 
tare la situazione paradossale di. cui si 
è detto, si deve ammettere che le due 
famiglie « pesino » in modo diverso sul¬ 
la determinazione della probabilità del¬ 
l’ipotesi delle pietre di Marte. La in¬ 
completezza delle soluzioni finora tro¬ 
vate dipende dal fatto che non si è an¬ 
cora in grado di dare un significato ai 
pesi che si assegnano alle famiglie. 

Conclusione 

Non ci sembra il caso di continua¬ 
re in questa direzione, esponendo cioè 
le proposte di interpretazione dei «pe¬ 
si » suddetti, quanto piuttosto di riflet¬ 
tere brevemente sulla influenza del pa¬ 
radosso sulla logica induttiva. Per far 
ciò è bene ricordare la situazione esi¬ 
stente prima della scoperta del para¬ 
dosso. Non si tratta beninteso di un pri¬ 
ma cronologico poiché il paradosso è 
una scoperta anteriore ai primi tentativi 
di costruire un sistema assiomatico per 
la logica induttiva, bensì di un prima 
metodologico. Nei primi tentativi che si 
sono compiuti per analizzare i metodi 
di assegnazione delle probabilità alle 
ipotesi induttive, era sembrato natura¬ 
le assumere che tutte le famiglie doves¬ 
sero essere trattate alla pari. Questa 
convinzione era suffragata dal fatto che 
la suddetta parità viene largamente usa¬ 
ta nella valutazione statistica dei risul¬ 
tati sperimentali, come abbiamo mo¬ 


strato quando abbiamo illustrato gli as¬ 
siomi della logica induttiva e come mo¬ 
stra una breve riflessione sui metodi 
statistici. 

La parità delle famiglie nei confronti 
della valutazione delle probabilità era 
quindi stata stabilita assiomaticamente. 
Convinti che la sua validità fosse uni¬ 
versale, la si era applicata anche al ca¬ 
so delle probabilità delle leggi di natu¬ 
ra (tale è infatti l’ipotesi delle pietre di 
Marte). La scoperta del paradosso se¬ 
gnò il fallimento del tentativo di affer¬ 
mare la validità universale dell’assioma 
che stabiliva la parità delle famiglie. 

La conclusione che i logici induttivi 
hanno tratto da questa sconfitta è, co¬ 
me abbiamo detto, un arricchimento 
concettuale della loro disciplina. Ci si 
è cioè accorti che l’assioma dell’inva¬ 
rianza in questione può essere accetta¬ 
to solo in casi particolari, per esempio 
a livello delle situazioni sperimentali 
affrontate dalla statistica, mentre in al¬ 
tri casi, per esempio per le leggi di na¬ 
tura, deve essere sostituito con assiomi 
più articolati che, stabilendo una gerar¬ 
chia fra le famiglie, evitino di appiat¬ 
tirle tutte allo stesso livello. 

È evidente che questa duttilità nel¬ 
l’uso degli assiomi è possibile solo se 
si pensa alla logica induttiva in mo¬ 
do non dogmatico, cioè solo se i suoi 
principi di base non sono intesi co¬ 
me verità incrollabili, bensì come stru¬ 
menti che debbono essere accetta¬ 
ti solo fin quando servono e che co¬ 
munque devono confrontarsi dialettica- 
mente con l’avanzare della ricerca. Ed 
è questa infatti la posizione dei mo¬ 
derni logici induttivi; essi sono in al¬ 
tri termini disposti ad accettare l’assio¬ 
ma dell’invarianza relativamente alle 
famiglie cosi come gli altri assiomi fin 
dove essi possono servire e sono inve¬ 
ce pronti ad abbandonarli non appena 
si rivelassero dannosi per il progresso 
delle loro ricerche. 

Abbiamo visto come il paradosso del¬ 
la conferma abbia aumentato la con¬ 
sapevolezza degli studiosi di logica in¬ 
duttiva e come lungi dal segnare la fi¬ 
ne di questa disciplina le abbia permes¬ 
so di scoprire nuove insospettate carat¬ 
teristiche delle modalità d’assegnazione 
delle probabilità alle ipotesi induttive. 
La breve storia che abbiamo fatto di 
questo paradosso ci ha inoltre fornito 
l’opportunità di porre in risalto la po¬ 
sizione di fondo su cui si reggono le 
ricerche di logica induttiva, posizione 
che si ispira alla grande tradizione del¬ 
la moderna epistemologia di cui accet¬ 
ta le istanze filosofiche che sono poi le 
istanze su cui si fonda tutta la ricer¬ 
ca scientifica moderna. 
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I problemi della conferma 

Per secoli i ricercatori hanno posto a controllo, hanno confermato e 
infirmato ipotesi mediante 1osservazione e resperimento. Eppure la 
logica di questo procedimento è ancora lungi dalVessere compresa 


di Wesley C. Salmon 


A 

opinione comune che la con¬ 
ferma di un’ipotesi scientifica 
consista nell’accertare che essa 
ha conseguenze vere. La teoria della 
gravitazione di Newton, per esempio, 
implicava che due corpi materiali qual¬ 
siasi esercitassero un’attrazione reci¬ 
proca. La teoria fu confermata dall’os¬ 
servazione del comportamento dei cor¬ 
pi in caduta, dei movimenti dei pianeti 
e del flusso e riflusso delle maree; essa 
ricevette conferma sperimentale diret¬ 
ta quando Henry Cavendish escogitò 
una bilancia di torsione per mezzo del¬ 
la quale diveniva possibile dimostrare 


in laboratorio l’attrazione tra due cor¬ 
pi. Tali scoperte non verificano una 
generalizzazione in modo conclusivo. 
Malgrado le molte diverse conferme 
sperimentali della teoria di Newton, 
essa non è più considerata compieta- 
mente accettabile. Si è presentata del¬ 
l’evidenza infirmante, e ora la fisica 
newtoniana è stata soppiantata dalla 
relatività einsteiniana. Indipendente¬ 
mente dalla sicurezza con cui sembra 
sia stabilita una teoria, non si può 
avere la certezza che essa non vada 
incontro a un destino analogo. Il mas¬ 
simo che si può dire è che i risultati 


sperimentali tendono a confermare una 
teoria e che in alcuni casi l’accumular¬ 
si dell’evidenza confermante innalza 
un’ipotesi generale allo stato di una 
accettabilità almeno provvisoria. 

La precedente caratterizzazione del 
controllo scientifico delle ipotesi può 
sembrare diretta e priva di problemi, e 
tuttavia è una ipersemplificazione. Nei 
dettagli mancanti si annida una molti¬ 
tudine di difficoltà fondamentali. Uno 
dei modi migliori per esporre alcuni 
dei problemi nascosti è quello di con¬ 
siderare una serie di semplici esem¬ 
pi, ognuno in possesso di qualche ca¬ 




li paradosso dei corvi è un esempio delle sottigliezze della teo¬ 
ria della conferma. Se tutti i corvi sono neri, sicuramente le co¬ 
se non-nere devono essere non-corvi. Poiché le due generaliz¬ 


zazioni sono logicamente equivalenti, ogni evidenza che confer¬ 
ma l’una conferma anche l’altra. Quindi un vaso colorato sem¬ 
bra fornire conferma all’ipotesi che tutti i corvi sono neri. 
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ratteristica paradossale o controintui¬ 
tiva. Bertrand Russell una volta ha 
osservato: « Una teoria logica può es¬ 
sere sottoposta a controllo saggiando 
la sua capacità di trattare i paradossi 
logici, ed è un procedimento salutare, 
quando ci si concentra su una teoria 
logica, corredare la mente con il mag¬ 
gior numero possibile di rompicapi lo¬ 
gici, la cui funzione non è molto di¬ 
versa da quella assolta dagli esperi¬ 
menti nella scienza fisica ». Anche se 
quest’affermazione nelle intenzioni di 
Russell doveva applicarsi in primo luo¬ 
go alla logica deduttiva, particolar¬ 
mente nella misura in cui questa en¬ 
tra nella matematica pura, penso si at¬ 
tagli egualmente bene alla logica della 
conferma nelle scienze empiriche. 

T a teoria della conferma non è nuo- 
■*“' va ai paradossi logici. Fin dagli an¬ 
ni quaranta i filosofi hanno aguzzato il 
loro ingegno su due celebri rompica¬ 
po. Il primo è il « paradosso dei cor¬ 
vi » di Cari G. Hempel, che può esse¬ 
re descritto nel modo che segue: 

L’osservazione di corvi neri (in as¬ 
senza di osservazioni di corvi di altro 
colore) verrebbe assunta normalmente 
a conferma della generalizzazione 
« Tutti i corvi sono neri ». Questo 
enunciato è logicamente equivalente a 
una seconda generalizzazione, « Tutte 
le cose non-nere sono non-corvi ». La 
osservazione di cose non-nere che so¬ 
no non-corvi (in assenza di osservazio¬ 
ne di corvi non-neri) sembrerebbe suo¬ 
nare a conferma di questa seconda ge¬ 
neralizzazione. Poiché le due genera¬ 
lizzazioni sono logicamente equivalen¬ 
ti tra loro, ciò che vale come evidenza 
per una delle due deve anche valere 
come evidenza per l’altra; Quindi l’os¬ 
servazione di un vaso verde (un non- 
-corvo non-nero) sembra costituisca 
un’evidenza per Tipo tesi « Tutti i cor¬ 
vi sono neri ». A quanto pare qualco¬ 
sa non funziona. 

Il secondo enigma è il « paradosso 
del verdlu-blerde », dovuto a Nelson 
Goodman. Siano definiti due termini 
molto particolari, designanti colori, 
« verdlu » e « blerde ». Si consideri un 
arbitrario punto futuro t a nel tempo. 
Di un oggetto esistente in un qualun¬ 
que tempo t, diremo che è verdlu in t 
se l’oggetto è verde e il tempo t è pre¬ 
cedente a t Q , ma se il tempo t è poste¬ 
riore a t a per potersi qualificare cosi 
l’oggetto deve essere blu. Se prendia¬ 
mo come t Q la mezzanotte del 31 di¬ 
cembre dell’anno 2000, un oggetto 
che esiste durante un periodo che si 
estende tanto nel secolo XX che nel 
XXI è verdlu durante tutto il periodo 
se è verde durante il XX secolo ma si 


tramuta in blu all’inizio del XXI se¬ 
colo, rimanendo blu in seguito. « Bler¬ 
de » è definito in modo analogo: un 
oggetto è blerde per tutto l’intero las¬ 
so di tempo se è blu prima della fine 
del XX secolo e verde in seguito. Verdlu 
e blerde sono termini strani, ma perfet¬ 
tamente ben definiti. 

Ora sembrerebbe normale il dire 
che l’osservazione di smeraldi verdi (in 
assenza di osservazioni di smeraldi di 
altri colori) tende a confermare la ge¬ 
neralizzazione « Tutti gli smeraldi so¬ 
no verdi ». Poiché però la data in cui 
vengono scritte queste parole è prece¬ 
dente a t a , ciascuno degli smeraldi os¬ 
servati come verdi è anche osservato 
come verdlu - almeno ora - per cui 
le stesse osservazioni confermano la 
ipotesi « Tutti gli smeraldi sono ver¬ 
dlu ». Che dovremmo prevedere, al¬ 
lora, relativamente agli smeraldi del 
XXI secolo? Saranno verdi? O saranno 
verdlu? (Come ha osservato Henry E. 
Kyburg jr., questo è uno dei problemi 
più impellenti di tutta la logica della 
conferma, in quanto abbiamo soltan¬ 
to 27 anni per risolverlo). 

La risposta con cui si reagisce im¬ 
mediatamente e abitualmente alla ter¬ 
minologia verdlu-blerde consiste nel 
dire che è « posizionale », e cioè che 
chiama in causa un riferimento arbi¬ 
trario a un punto particolare nel tem¬ 
po. Questo è certamente vero se par¬ 
tiamo dalle parole del linguaggio or¬ 
dinario. Come ha osservato Goodman, 
tuttavia, se noi partiamo dalla termi¬ 
nologia verdlu-blerde, allora le parole 
con cui ordinariamente designamo i 
colori risultano posizionali: « verde » 
significa « verdlu prima di t, ma bler¬ 
de dopo questo momento ». C’è una 
qualche ragione per preferire la ter¬ 
minologia ordinaria, oppure la nostra 
preferenza per questa rispetto alla ter¬ 
minologia verdlu-blerde di Goodman è 
semplicemente il risultato di un acci- 
cente storico? 


j^elTintraprendere il controllo di una 
ipotesi un ricercatore usa Tipotesi 
per prevedere qualche fenomeno la 
cui occorrenza o non-occorrenza può 
essere appurata dall’osservazione. Tut¬ 
tavia un’ipotesi generale non implica 
logicamente, di per se stessa, dei fatti 
osservabili: Tipotesi deve essere appli¬ 
cata a qualche situazione particolare la 
cui descrizione costituisce un insieme 
di « condizioni iniziali ». Per poter pre¬ 
vedere un’eclisse, per esempio, l’astro¬ 
nomo deve conoscere non solo le leg¬ 
gi del moto che governano la Terra e 
il suo satellite naturale, ma anche le 
posizioni relative della Terra, della 
Luna e del Sole in qualche momento 


particolare; dalle leggi del moto con¬ 
giunte alle condizioni iniziali egli può 
dedurre il tempo e il luogo di una 
eclisse solare totale. Spesso è necessa¬ 
rio manipolare le circostanze cosi da 
ottenere un insieme di condizioni ini¬ 
ziali adeguate al controllo di una de¬ 
terminata ipotesi; questo è quanto si 
fa nell’esecuzione di un esperimento. 

C’è un paradosso proposto da Rus¬ 
sell che è direttamente pertinente al 
tipo di schema sperimentale che or 
ora ho abbozzato. Si consideri Tipo¬ 
tesi: « I maiali hanno le ali ». In con¬ 
giunzione con il fatto osservato (con¬ 
dizione iniziale) che la carne di maiale 
è di gusto gradevole, deduciamo la 
conseguenza (prediciamo) che alcune 
creature alate sono di gusto gradevole. 
Quando vediamo che comunemente si 
mangiano di gusto anatre e tacchini, 
osserviamo che la conseguenza - o la 
previsione - è vera; e a quanto pare 
abbiamo una conferma dell’ipotesi 
originaria. 

Non c’è sforzo di immaginazione 
che possa far si che la verifica di una 
tale conseguenza fornisca un sostegno 
qualsiasi all’ipotesi in questione. Se 
chiamiamo « esempio positivo » un da¬ 
to come questo, con ciò intendendo 
che si accorda con la previsione dedot¬ 
ta, dobbiamo concludere che gli esem¬ 
pi positivi non forniscono necessaria¬ 
mente la minima credibilità all’ipotesi. 
Questo esempio apparentemente scioc¬ 
co sottolinea una morale profonda e 
significativa: la conferma scientifica è 
qualcosa di più che non il reperimen¬ 
to di conseguenze vere. 

Se ragioniamo deduttivamente dal¬ 
le premesse « Tutti i mammiferi sono 
pelosi » e « Le balene sono mammife¬ 
ri » alla conclusione « Le balene sono 
pelose », possiamo essere sicuri che la 
conclusione sarà vera se sono vere le 
premesse (come effettivamente sono); 
questa è essenzialmente la caratteristi¬ 
ca definitoria dell’inferenza deduttiva 
valida. Nella deduzione, tuttavia, ra¬ 
gionare a ritroso dalla verità della 
conclusione alla verità delle premesse 
è un banale errore logico (noto come 
« fallacia dell’affermare il conseguen¬ 
te »). D’altro canto dal punto di vista 
dell’induzione scientifica suona assai 
attendibile la supposizione che l’osser¬ 
vazione di pelosità nelTembrione di 
balena (un mammifero, notoriamente) 
costituisce un’evidenza per la genera¬ 
lizzazione che tutti i mammiferi sono 
pelosi. Questo doppio binario ha por¬ 
tato Morris R. Cohen a caratterizzare 
spiritosamente i testi di logica come 
libri divisi in due parti: nella prima 
[sulla deduzione] si illustrano le fal- 
laciae, e nella seconda [sull’induzione 
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o sul netodo scientifico] tali fallaciae 
si con.mettono a quanto pare impu¬ 
nemente. L’esempio russelliano dei 
maiali alati prova che, tuttavia, ci so¬ 
no esempi del sofisma dell’affermare il 
conseguente che non si qualificano au¬ 


tomaticamente come conferme scienti¬ 
fiche valide. 

La relazione di implicazione logica 
ha l’ovvia e importante proprietà del¬ 
la transitività: se A implica logica¬ 
mente B e B implica logicamente C, 


allora A implica logicamente C. Se 
la deducibilità di conseguenze vere 
esaurisse tutto ciò che c’è da dire sul¬ 
la conferma, allora sarebbe anch’essa 
una relazione transitiva. Se C dovesse 
confermare B per il fatto che segue da 
B, e se B dovesse confermare A in 
quanto segue da A, allora C dovrebbe 
confermare A poiché C seguirebbe da 
A per la transitività dell’implicazione 
logica deduttiva. In verità sembrereb¬ 
be intuitivo ritenere la conferma una 
relazione transitiva. Il ragionamento 
che segue era effettivamente citato 
come esempio di ragionamento indut¬ 
tivo valido in un libro pubblicato una 
dozzina di anni or sono: « Dal momen¬ 
to che, se qui c’era fumo, c’era molto 
probabilmente fuoco, e se qui c’era fu¬ 
liggine c’era molto probabilmente fu¬ 
mo, quindi, poiché qui c’era fuliggine, 
qui c’era probabilmente fuoco ». E tut¬ 
tavia questo ragionamento ha sostan¬ 
zialmente la stessa struttura logica del 
ragionamento che segue: Poiché è mol¬ 
to probabile che un qualsiasi scienziato 
tra quelli vissuti in tutti i tempi sia vivo 
oggi (essendo stato calcolato che il 
90 % di tutti gli scienziati è ancora 
vivo), e poiché è molto probabile che 
un qualsiasi organismo vivo oggi sia 
un microorganismo, allora, dato che 
Rossi è uno scienziato, è probabile che 
sia un microorganismo. 

Questo esempio prova inequivocabil¬ 
mente che A (essere uno scienziato) 
può fornire conferma a B (essere vivo 
attualmente), e B può a sua volta for¬ 
nire sostegno a C (essere un microor¬ 
ganismo), mentre A non solo manca 
miseramente di confermare C ma è 
addirittura incompatibile con esso. 
L’esempio illustra un serio rischio sot¬ 
tostante alle riflessioni sulla conferma: 
il pericolo di affidarsi ad analogie in¬ 
fondate con la deduzione. Viene spon¬ 
taneo assumere intuitivamente che le 
proprietà delle relazioni deduttive si 
applichino più o meno esattamente al¬ 
la logica della conferma. Questo non 
è vero. Alcune delle proprietà più im¬ 
portanti delle relazioni deduttive ven¬ 
gono meno in modo completo e asso¬ 
luto quando ci si allontana, anche di 
poco, dalla logica deduttiva stessa. La 
relazione di transitività è un eccellente 
esempio di questo fenomeno. 

T 'antidoto migliore contro gli errori 
che sorgono dalle intuizioni relati¬ 
ve alla conferma, consiste, a mio avvi¬ 
so, nel concentrare l’attenzione sulla 
teoria matematica della probabilità 
(si veda l’illustrazione in basso a pa¬ 
gina 108). Se è possibile considera¬ 
re la conferma come un tipo di pro¬ 
babilità, è facile provare che le re- 



« I maiali hanno le ali » è l’ipotesi considerata. Il ricercatore sa che la carne di maiale 
è di gusto gradevole. In base all’ipotesi egli prevede che alcune creature alate devono 
essere di gusto gradevole. Per controllare l’ipotesi assaggia l’anitra e, trovandola di gu¬ 
sto gradevole, considera l’ipotesi confermata. (Il maiale — canard in francese oltre che 
anatra significa frottola — mostra di conoscere l’irrilevanza di questa conseguenza vera.) 


106 







































La transitività è una proprietà dell’implicazione logica: se essere una balena implica 
logicamente essere un mammifero ed essere un mammifero implica logicamente essere 
peloso, allora essere una balena implica logicamente essere peloso. Il corrispettivo pro¬ 
babilistico è più complesso: la probabilità che un essere umano (A) si ammali di can¬ 
cro polmonare (C) è uguale alla probabilità che (A) sia un fumatore (B) per la proba¬ 
bilità che un fumatore (A e B) si ammali di cancro più la probabilità che (A) sia un 
non-fumatore (non-B) per la probabilità che un non-fumatore (A e non-B) si ammali. 


lazioni di conferma non sono transi¬ 
tive. Si può anche provare che la ve¬ 
rità della conseguenza di una ipotesi 
non accresce necessariamente la pro¬ 
babilità di quella ipotesi. Anche se 
mettiamo scopertamente in gioco il 
calcolo delle probabilità, c’è tuttavia 
ancora pericolo che si produca una se¬ 
ria confusione, provocata da una sem¬ 
plice ambiguità. 

Dire, per esempio, che la teoria del¬ 
la relatività ristretta è stata conferma¬ 
ta potrebbe significare l’una o l’altra di 
due cose diverse. O qualche elemento 
di evidenza, come il recente esperi¬ 
mento relativo al ritardo relativistico 
di orologi in movimento, ha aumenta¬ 
to in qualche misura la credibilità del¬ 
la teoria, o la teoria è stata sostenuta 
da un corpo di evidenza cosi largo e 
svariato da potersi considerare, alme¬ 
no provvisoriamente, una legge scien¬ 
tificamente accettabile. Un’ipotesi ge¬ 
nerale che abbia inizialmente una cre¬ 
dibilità relativamente bassa può veder¬ 
la accresciuta in qualche misura dal¬ 
la nuova evidenza senza con ciò attin¬ 
gere un alto grado di conferma. In 
casi siffatti un’ipotesi può essere ovvia¬ 
mente confermata in un senso senza 
essere confermata nell’altro. Conve¬ 
niamo di parlare dell’accrescimento di 
probabilità di un’ipotesi come di con¬ 
ferma « incrementale » e del raggiun¬ 
gimento di un’alta probabilità come di 
conferma « assoluta ». Al fine di sotto- 
lineare la distinzione circoscriviamo il 
termine « confermato » (senza qualifi¬ 
ca) al senso incrementale e impieghia¬ 
mo sempre un’espressione come « alta¬ 
mente confermato » per il senso asso¬ 
luto. Dovremmo dire, allora, che la 
teoria della relatività ristretta è stata 
confermata daH’esperimento di ritar¬ 
do dell’orologio e che è altamente con¬ 
fermata dal corpo di evidenza totale 
che lo sostiene. 

Anche se la distinzione tra questi 
due sensi di conferma è ovvia ed è 
stata riconosciuta da lungo tempo, le 
sue implicazioni non sempre sono sta¬ 
te chiaramente riconosciute. Come da¬ 
to di fatto, il senso incrementale ha 
alcune strane proprietà che vengono 
correntemente trascurate in quanto 
non sono condivise dal concetto asso¬ 
luto. Si consideri l’esempio che segue, 
il quale, benché totalmente fittizio, 
espone tuttavia circostanze logicamen¬ 
te possibili. 

Bianchi consulta il suo medico per 
un disturbo respiratorio. Dopo un esa¬ 
me preliminare il medico dice di rite¬ 
nere che Bianchi abbia la polmonite 
ma di non essere sicuro se essa sia bat¬ 
terica, virale oppure (eventualità mol¬ 
to rara) di ambedue i tipi insieme. Si 


rende necessario un controllo ulterio¬ 
re. Bianchi è sottoposto al test pre¬ 
scritto. Il medico gli dice che il test ha 
confermato l’ipotesi che la malattia 
sia polmonite batterica e ha anche 
confermato l’ipotesi che sia polmonite 
virale, ma ha infirmato l’ipotesi che 
Bianchi abbia la polmonite! La mag¬ 
gior parte di noi troverebbe poco da 
ridire se Bianchi a questo punto si ri¬ 
volgesse a un altro medico. 

Eppure può darsi che il medico sia 
dalla parte della ragione. Si supponga 
che sulla base dell’esame superficiale 
egli concluda che c’è un 96 % di pro¬ 
babilità che Bianchi abbia la polmo¬ 
nite, senza però avere indicazioni sul 
fatto che essa sia batterica o virale 
(assumendo che questi siano gli unici 
due tipi). Inoltre egli stabilisce che c’è 
la probabilità del 2 % che Bianchi ab¬ 
bia ambedue i tipi di polmonite. Con¬ 
seguentemente la probabilità che Bian¬ 
chi abbia la polmonite batterica è del 
49 % e la probabilità che abbia la pol¬ 
monite virale è pure del 49 %. Si sup¬ 
ponga inoltre che ci sia un test che ri¬ 
leva molto attendibilmente i rari casi 
in cui sono presenti insieme ambedue 
i tipi. Quando il test è somministrato 
a Bianchi, il risultato è positivo, ren¬ 
dendo certo all’89 % il fatto che egli 
ha ambedue i tipi. Si assuma inoltre 
che raramente questo test risulta sba¬ 
gliato per chi ha solo un tipo di pol¬ 
monite; cioè, se il risultato è positivo 
e l’individuo non ha ambedue i tipi, 
molto probabilmente non ha nessuno 
dei due tipi. In particolare il risultato 
positivo del test significa che c’è la 


probabilità del 90 % che Bianchi ab¬ 
bia la polmonite batterica, la probabi¬ 
lità del 90 % che abbia la polmonite 
virale e conseguentemente la probabi¬ 
lità del 91 % che abbia una o l’altra 
o ambedue (si veda Villustrazione a 
pagina 110). 

Q uesto fantasioso esempio illustra la 
eventualità che l’evidenza possa 
confermare ciascuna delle due ipotesi 
e tuttavia infirmare la loro disgiunzio¬ 
ne (la combinazione l’uno-o-l’altro-o- 
ambedue). In questo caso il risultato 
del test speciale ha accresciuto la pro¬ 
babilità che Bianchi avesse la polmoni¬ 
te batterica e anche la probabilità che 
avesse la polmonite virale, mentre nel¬ 
lo stesso tempo ha abbassato la pro¬ 
babilità che avesse l’una o l’altra - in 
altri termini, dato che ce ne sono 
soltanto due tipi, la probabilità che 
avesse la polmonite! 

Per vedere come questo è possi¬ 
bile dobbiamo rivolgerci alla rego¬ 
la di addizione per probabilità (si veda 
l’illustrazione in basso a pagina 108). 
Al fine di calcolare la probabilità per 
una disgiunzione di alternative non 
esclusive sommiamo le probabilità di 
ciascuna delle due alternative pre¬ 
se separatamente e quindi sottraia¬ 
mo la probabilità della loro occor¬ 
renza congiunta. Per esempio, la pro¬ 
babilità di estrarre da un normale 
mazzo da bridge o un onore (un asso, 
un re, una regina, un fante o un 10) 
o un atout (poniamo un picche) è 
eguale alla probabilità di un onore 
(20/52) più la probabilità di un picche 
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« Tutti » e « quasi tutti> possono essere molto diversi. Dato che 
tutti gli A sono B e tutti i B sono C, deve essere vero che tutti 
gli A sono C (a sinistra). Tuttavia, dato che quasi tutti gli A so¬ 
no B e quasi tutti i B sono C, può verificarsi che nessun A sia C 


(a destra). Nell’esempio del testo, anche se per la maggior parte 
gli scienziati (A) risultano essere esseri viventi (B) e per la mag¬ 
gior parte gli esseri viventi (B) sono microorganismi (C), 
non ci sono affatto scienziati che risultano microorganismi. 


(13/52) meno la probabilità di un ono¬ 
re di picche (5/52). La sottrazione è 
necessaria poiché gli onori di picche 
sono stati, per cosi dire, contati due 
volte: una volta come onori, una se¬ 
conda come picche. La risposta risulta 
28/52 (si veda l’illustrazione a pag. 111). 
Nell’esempio della polmonite la pro¬ 
babilità della disgiunzione decresce 
mentre aumenta la probabilità di cia¬ 
scuna delle alternative in virtù dell’al¬ 
ta probabilità (89 %) dell’occorrenza 
congiunta (o contata due volte) dopo 
il test, in contrasto con la sua bassa 
probabilità (2 %) prima del test. 

Risultati come questi sono tipici 
della conferma incrementale, e suona¬ 
no sconcertanti in parte perché c’è una 
tendenza naturale a confondere il con¬ 
cetto incrementale con quello assolu¬ 
to. La conferma in senso assoluto si¬ 
gnifica che un’ipotesi ha un’alta pro¬ 
babilità di essere corretta. Se la pol¬ 


monite virale è altamente confermata 
in senso assoluto, allora la polmonite 
è per lo meno confermata nello stesso 
grado. Questo perché l’avere la polmo¬ 
nite (di qualche tipo) è una conseguen¬ 
za logica dell’avere la polmonite vira¬ 
le, e una regola fondamentale della 
probabilità matematica afferma che la 
probabilità attribuita alla conseguenza 
logica di una proposizione è uguale o 
maggiore a quella della proposizione 
stessa. Non ho violato questa condi¬ 
zione nel descrivere il caso di Bian¬ 
chi: la probabilità della polmonite è 
maggiore di quella della polmonite vi¬ 
rale in base alla diagnosi preliminare, 
nonché in base al test speciale. E tut¬ 
tavia, quando ci si mette dal punto di 
vista della conferma incrementale (un 
cambiamento nella conferma) risulta 
che la nuova evidenza può accrescere 
la probabilità di una proposizione e 
tuttavia diminuire la probabilità di una 


delle sue conseguenze.. Questo è un 
sorprendente contrasto logico tra con¬ 
ferma incrementale e assoluta. 

Possono verificarsi fatti anche più 
strani. Supponiamo che due ricercatori 
si accingano a sottoporre a controllo 
una ipotesi. Ciascuno dei due si reca 
al suo laboratorio per eseguire un 
esperimento e ciascuno acquisisce una 
scoperta positiva: una conferma del¬ 
l’ipotesi. Può mai accadere che, anche 
se ciascuna delle scoperte conferma la 
ipotesi, la loro congiunzione infirmi la 
stessa? Sì, è logicamente possibile. 

Siano A e B gli atomi di un iso¬ 
topo immaginario che può decadere 
radioattivamente in uno qualsiasi di 
tre modi diversi. Dato il verificarsi del¬ 
la disintegrazione, c’è una probabilità 
di 0,7 che sia stata emessa una parti- 
cella alfa, una probabilità di 0,2 che 
sia stato emesso un elettrone negativo, 
e una probabilità di 0,1 che sia stato 


ADDIZIONE 

PROBABILITÀ (A O B) = PROBABILITÀ (A) + PROBABILITÀ (B) - PROBABILITÀ (A E B). 

CONSEGUENZA LOGICA 

SE A IMPLICA LOGICAMENTE B, ALLORA PROBABILITÀ (B) È EGUALE O MAGGIORE ALLA 

PROBABILITÀ (A). 

MOLTIPLICAZIONE 

PROBABILITÀ (A E B) = PROBABILITÀ (A) X PROBABILITÀ (B, DATO A). 

TEOREMA DI BAYES 

PROBABILITÀ (A) X PROBABILITÀ (B, DATO A) 

PROBABILITÀ (A, DATO B) =- ; - 

PROBABILITÀ (B). 


Il concetto di probabilità svolge nella conferma empirica lo stes- tematica. Sono qui elencate alcune regole della probabilità men- 

so ruolo che svolge la deduzione logica nella dimostrazione ma- zionate nel testo. Un’altra è illustrata nella pagina precedente. 
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emesso un elettrone positivo (posite¬ 
ne). Si supponga che ambedue questi 
atomi siano appunto stati disintegrati e 
che le particelle emesse si accostino 
tra loro. Prendiamo in considerazione 
l’ipotesi che incontrandosi esse si anni¬ 
chilino reciprocamente, cosa che si ve¬ 
rificherà se e solo se una particella è 
un elettrone negativo e l’altra è un 
positene. Supponendo di non disporre 
di informazioni ulteriori, la probabili¬ 
tà dell’annichilazione è 0,2 per 0,1 più 
0,1 per 0,2, ossia 0,04. Supponiamo che 
un fisico scopra che un atomo A ha 
emesso un elettrone; in base a questa 
evidenza la probabilità che si verifichi 
l’annichilazione è di 0,1, giacché è 
questa la probabilità che B emetta un 
positone. Supponiamo che un altro fi¬ 
sico scopra che l’atomo B ha emesso 
un positone; in base a questa evidenza 
(ma senza l’evidenza ottenuta dal pri¬ 
mo fisico) c’è, analogamente una pro¬ 
babilità di 0,1 che si verifichi l’anni- 
chilazione. Eppure sulla base di am¬ 
bedue gli elementi di evidenza in con¬ 
giunzione è chiaro che l’annichilazio- 
ne è impossibile. 

Ciascuno dei due elementi di eviden¬ 
za conferma, separatamente, l’ipotesi 
dell’annichilazione (ciascuno innalza la 
sua probabilità da 0,04 a 0,1). In con¬ 
giunzione, tuttavia, essi non solo la in¬ 
firmano, ma di fatto la refutano. Po¬ 
trebbe mai verificarsi una cosa del ge¬ 
nere nel corso di una indagine? In un 
esperimento relativo alla diffusione 
Compton di fotoni da parte di 'elettroni 
un fisico potrebbe misurare la fre¬ 
quenza di fotoni dispersi con un an¬ 
golo particolare mentre un altro po¬ 
trebbe misurare l’energia degli elettro¬ 
ni di rinculo. Anche se ciascun insie¬ 
me di misure conferma l’ipotesi del¬ 
la diffusione Compton, come si può 
essere sicuri che continuino a farlo 
presi insieme? Nel caso della diffusio¬ 
ne Compton accade che la congiunzio¬ 
ne delle scoperte conferma l’ipotesi, 
ma questo non segue automaticamen¬ 
te dal semplice fatto che, separata- 
mente prese, le scoperte sono confer¬ 
me; esso dipende da diverse circo¬ 
stanze, compreso il fatto che la con¬ 
giunzione stessa è una delle previsioni 
della teoria. L’esempio dell’annichila- 
zione prova, tuttavia, che ci sono que¬ 
stioni profonde e fondamentali circa 
la legittimità del supporre che l’accu¬ 
mulazione di molti risultati di test 
confermanti accresca inevitabilmente 
la credibilità delle ipotesi scientifiche. 

Ji 1 inora abbiamo parlato solo di con¬ 
ferma, o del caso in cui il risultato 
del test è positivo. Resta da discutere 
il risultato del test negativo: il caso in 


cui la previsione dell’ipotesi risulta fal¬ 
sa. Si è spesso sostenuto che c’è una 
forte asimmetria tra i casi positivi e 
negativi a ragione di una semplice cir¬ 
costanza logica: che mentre l’inferen¬ 
za da una conclusione vera alla verità 
delle premesse è un caso di fallacia 
deH’affermare il conseguente, l’infe¬ 
renza dalla falsità della conclusione 
alla falsità di almeno una premessa è 
perfettamente valida; essa è nota co¬ 
me modus tollens, o « negare il con¬ 
seguente ». Poiché una deduzione va¬ 
lida è definita come quella la cui con¬ 


clusione deve essere vera se ha pre¬ 
messe vere, possiamo effettivamente 
concludere che un ragionamento de¬ 
duttivo valido con una conclusione 
falsa non può avere premesse che so¬ 
no tutte vere. Sembra quindi che un 
esito negativo non solo infirmi una 
ipotesi ma di fatto la refuti. 

La situazione non è affatto sempli¬ 
ce. Come ha fatto notare Pierre Du- 
hem, nella maggior parte dei casi in 
cui si intraprende il controllo di una 
ipotesi scientifica, per non dire in tut¬ 
ti, entrano in gioco ipotesi ausiliarie. 



La teoria della relatività permette di prevedere che quanto più velocemente è traspor¬ 
tato un orologio, tanto più lentamente procede. L’anno scorso Joseph C. Hafele della 
Università di Washington, insieme ad altri, ha riferito di un esperimento in cui orologi 
al cesio erano stati trasportati in un giro del mondo su jet commerciali in direzioni op¬ 
poste. In relazione alle stelle fisse uno si muoveva circa 1000 chilometri più velocemente 
della Terra, e l’altro 1000 chilometri più lentamente; uno avrebbe dovuto perdere tem¬ 
po, e l’altro guadagnarlo, rispetto agli orologi di riferimento a terra. Gli scarti di tempo 
risultarono vicini ai valori previsti, fornendo in questo modo conferma alla teoria. 
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PROBABILITÀ (POLMONITE) = PROBABILITÀ (BATTERICA) 
+ PROBABILITÀ (VIRALE) - PROBABILITÀ (AMBEDUE), OSSIA 
0,49 + 0,49 - 0,02 = 0,96 


0,49 



PROBABILITÀ (POLMONITE) = PROBABILITÀ (BATTERICA) 
+ PROBABILITÀ (VIRALE) - PROBABILITÀ (AMBEDUE), OSSIA 
0,90 + 0,90 - 0,89 = 0,91 

0,90 


090 1 

r n 



l 


J 


0,89 


0,91 


Ciò che conferma ciascuna delle due ipotesi può contempora¬ 
neamente infirmare la loro disgiunzione. Dopo un esame super¬ 
ficiale il medico decide che c’è la probabilità del 96 % che 
Bianchi abbia la polmonite: non sa se batterica o virale, ma ri¬ 
tiene che ci sia solo la probabilità del 2 % che siano presenti 


ambedue i tipi. Le probabilità sono schematizzate dalle linee 
sovrapposte (a sinistra). Si predispone un test di controllo. Il 
risultato accresce notevolmente la probabilità che Bianchi abbia 
la polmonite batterica e anche quella che abbia la polmonite vi¬ 
rale, ma riduce al 91 % quella che abbia la polmonite (a destra). 


Nel sottoporre a controllo una teoria 
astronomica è probabile vengano usati 
telescopi e altri strumenti, cosicché 
vengono chiamate in causa le leggi 
dell’ottica e altre leggi nello sforzo di 
stabilire una connessione tra una mac¬ 
chia su una lastra fotografica e un 
corpo celeste. In una scienza a un cer¬ 
to grado di sofisticazione le condizioni 
iniziali richieste per sottoporre a con¬ 
trollo una ipotesi sono difficilmente 
accertabili per mezzo di osservazione 
diretta; occorrono delle ipotesi ausilia- 
rie per correlare ciò che si osserva ef¬ 
fettivamente alle condizioni iniziali op¬ 
portune. Inoltre, gli esiti previsti pos¬ 
sono essere in qualche misura lonta¬ 
ni dall’osservazione diretta, e di nuo¬ 


vo entrano in gioco ipotesi ausiliarie. 

Il risultato evidente di queste com¬ 
plicazioni è che l’esito negativo del 
test sperimentale di un’ipotesi non si 
può prendere automaticamente come 
refutazione di quell’ipotesi. Il risultato 
negativo del test prova soltanto che 
da qualche parte c’è qualcosa che non 
va. Può darsi che l’ipotesi sottoposta 
a controllo sia falsa o può darsi che 
sia falsa qualche ipotesi ausiliaria. 

A rigore, il risultato negativo non 
fa che confutare la congiunzione del¬ 
le ipotesi ausiliarie e dell’ipotesi sotto 
controllo; ma non refuta l’ipotesi sot¬ 
toposta a controllo di per se stessa. 
(Come interessante esempio storico, si 
considerino le false previsioni circa i 


movimenti di Urano emerse dalla mec¬ 
canica newtoniana del XIX secolo. An¬ 
ziché confutare la fisica newtoniana 
essere portarono alla scoperta di Net¬ 
tuno; l’esito negativo fu attribuito al¬ 
l’ipotesi ausiliaria o forse alle stesse 
condizioni iniziali. Più tardi, tuttavia, 
le irregolarità nell’orbita di Mercurio 
non portarono alla scoperta di un nuo¬ 
vo pianeta secondo quanto era stato 
previsto in base alla meccanica new¬ 
toniana ma piuttosto al tracollo defi¬ 
nitivo della meccanica newtoniana: la 
precessione del perielio di Mercurio è 
stato un primo elemento di evidenza 
cruciale per la teoria della relatività 
generale di Einstein). 

Alla luce della fondamentale intui- 
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zione di Duhem che morale bisogne¬ 
rebbe trarre, agli effetti del conferma¬ 
re o infirmare un’ipotesi, dall’esito ne¬ 
gativo di un test? Sicuramente o è in¬ 
firmata l’ipotesi sotto controllo o so¬ 
no infirmate in qualche misura le ipo¬ 
tesi ausiliarie; sicuramente né le ipo¬ 
tesi ausiliarie né l’ipotesi principale 
possono essere confermate dall’esito 
negativo. Ambedue queste assunzioni 
suonano plausibili ma sono sbagliate. 
È logicamente possibile che un esito 
sperimentale refuti la congiunzione di 
due ipotesi e tuttavia confermi ciascu¬ 
na di esse presa individualmente. Que¬ 
sta possibilità è strettamente correlata 
all’esempio del decadimento. 

Assumiamo lo stesso sistema di ato¬ 
mi dell’esempio: gli atomi A e B han¬ 
no ciascuno tre possibili modalità di 
decadimento, con probabilità 0,7 per la 
particella alfa, 0,2 per l’elettrone ne¬ 
gativo e 0,1 per il positone. Questa 
volta l’evidenza osservata è l’annichi- 
lazione delle particelle. Consideriamo 
l’ipotesi che l’atomo A emetta un elet¬ 
trone negativo. Poiché sappiamo, in 
virtù dell’annichilazione, che uno de¬ 
gli atomi ha emesso un elettrone ne¬ 
gativo, senza sapere quale, l’ipotesi che 
esso sia stato emesso da A ha proba¬ 
bilità 0,5. Lo stesso vale per l’ipotesi 
che B emetta un elettrone negativo. Il 
fatto che si sia verificata l’annichila- 
zione rende tuttavia impossibile la 
emissione da parte di ambedue gli ato¬ 
mi di elettroni negativi; esso perciò re¬ 
futa la congiunzione delle due ipotesi. 
Nondimeno proprio questa evidenza 
conferma separatamente ciascuna del¬ 
le due ipotesi, in quanto in ognuno 
dei casi ha innalzato la probabilità da 
0,2 a 0,5. 

Si immagini che cosa potrebbe signi¬ 
ficare questo genere di fatti per la me¬ 
todologia scientifica. Lo scienziato 
Verdi, torna a casa a tarda sera dopo 
una dura giornata di laboratorio. 
« Come è andato il tuo lavoro oggi, 
caro? » chiede sua moglie. 

« Sai della “ipotesi di Verdi”, su cui 
ho impegnato per intero la mia repu¬ 
tazione? Be’, oggi l’ho sottoposta a 
una verifica sperimentale, e l’esito è 
stato negativo ». 

« Oh caro, che peccato! Questo si¬ 
gnifica forse che la tua ipotesi predi¬ 
letta è affossata e che la tua reputa¬ 
zione scientifica è a pezzi? ». 

« Non del tutto. Per eseguire il test 
ho fatto uso di alcune ipotesi au¬ 
siliarie ». 

« Oh che sollievo, salvato da Du¬ 
hem! La tua ipotesi dopo tutto non è 
stata refutata ». La signora Verdi trae 
un profondo sospiro. 

« Meglio ancora » continua Verdi. 


« Ho addirittura confermato l’ipotesi. » 

« Oh, caro, è meraviglioso! » rispon¬ 
de la signora Verdi. « Devi aver tro¬ 
vato che respingendo l’ipotesi ausilia- 
ria potevi provare che il test sosteneva 
effettivamente la tua ipotesi. Che in¬ 
telligenza! ». 

« No » continua Verdi « è ancora 
meglio. Ho scoperto di aver confer¬ 
mato anche l’ipotesi ausiliaria! » 

Queste inconsuete possibilità sembra 
facciano strazio della metodologia 
scientifica. Il fatto che gli scienziati 
del giorno d’oggi nella pratica quoti¬ 
diana non si imbattano realmente in 
difficoltà del genere può essere consi¬ 
derato da molti una prova del fatto 
che la conferma è questione di intui¬ 
zione scientifica e resiste a tutti i ten¬ 
tativi di formalizzazione. Io non credo 
che tale conclusione sia giustificata, e 
sosterrò il mio punto di vista metten¬ 
do in luce un parallelo con la storia 
del concetto di dimostrazione in mate¬ 
matica. 

jjidea di dimostrazione in matemati¬ 
ca è emersa verso il 600 a.C. Si at¬ 
tribuisce a Talete di Mileto il merito 
di aver importato la geometria dal¬ 
l’Egitto alla Grecia e di aver contri¬ 
buito al processo che ha trasformato 
questa in una scienza matematica. An¬ 
che se gli Egiziani avevano applicato 
la geometria nel rilevamento topogra¬ 
fico, nulla prova che essi abbiano di¬ 
mostrato in realtà un qualsiasi teore¬ 
ma geometrico; si crede che Talete ab¬ 
bia dimostrato, oltre ad altri teoremi, 
che gli angoli alla base di un triangolo 
isoscele sono eguali. AU’incirca verso 
il 300 a.C. Euclide aveva riformulato 
la geometria come un sistema assioma¬ 
tico in cui tutti i teoremi devono es¬ 
sere dedotti da un piccolo numero di 
assiomi o postulati. Alcuni frammen¬ 
ti elementari di logica deduttiva furo¬ 
no sviluppati nell’antichità da Aristo¬ 
tele e dai filosofi stoici. Eppure non fu 
prima del 1879 che Gottlob Frege svi¬ 
luppò una logica deduttiva che poteva 
cominciare a caratterizzare adeguata- 
mente la deduzione in matematica. Ci 
vollero quindi come minimo 2500 an¬ 
ni, dal tempo in cui furono per la 
prima volta impiegate delle dimostra¬ 
zioni matematiche, perché i logici 
giungessero a un chiaro intendimen¬ 
to della loro natura. 

La logica matematica è fiorita negli 
ultimi 100 anni, e sono stati stabiliti 
molti risultati importanti. Questo pro¬ 
cesso non è stato privo di vicissitudini. 
Per esempio Russell ha scoperto una 
celebre contraddizione proprio nella 
logica su cui Frege aveva cercato di 
basare tutta la matematica. Essa sor¬ 


geva dalla considerazione di paradossi 
simili a quello famoso del barbiere: 
In una certa città c’è un barbiere che 
rade tutti gli uomini che non si ra¬ 
dono da soli. Chi rade il barbiere? 

Il fatto che i matematici nella loro 
attività non si siano trovati costante- 
mente inviluppati in contraddizioni 
non ha impedito al paradosso di Rus¬ 
sell di costituire un fattore di crisi nei 
fondamenti della matematica. Altri 
sviluppi sconcertanti, come la dimo¬ 
strazione data da Kurt Godei della es¬ 
senziale incompletezza dell’aritmetica, 
erano a dir poco preoccupanti, per 
quanto non portassero alla luce di per 
sé delle contraddizioni. 

Gli scienziati empirici hanno fatto 
osservazioni e compiuto esperimenti 
per controllare ipotesi complesse fin 
dalla nascita della scienza moderna, 
nei secoli XVI e XVII. Quando si trat- 



PROBABILITÀ (ONORE O PICCHE) = 
PROBABILITÀ (ONORE) + PROBABILITÀ 

(PICCHE) - PROBABILITÀ (ONORE DI PICCHE), 
OSSIA 20/52 + 13/52 - 5/52 = 28/52 

La probabilità di estrarre un onore o un 
picche è determinata dall’addizione delle 
probabilità, come qui si fa vedere. La sot¬ 
trazione dei cinque onori di picche è ne¬ 
cessaria perché, come indicano i rettango¬ 
li, altrimenti questi vengono contati due 
volte. La probabilità all’89 % dell’occor- 
renza congiunta della polmonite batterica e 
virale dell’esempio precedente risulta ana¬ 
loga all’occorrenza dell’onore di picche. 
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ta di trarre conclusioni dai risultati di 
queste osservazioni ed esperimenti, sia¬ 
mo ben lungi dall’avere una chiara 
comprensione del tipo di ragionamen¬ 
to che entra in gioco. Ora siamo in 
una situazione analoga a quella in cui 
si trovava la matematica durante i mil¬ 
lenni in cui la dimostrazione matema¬ 
tica era usata spesso e con buoni ri¬ 
sultati, mentre la logica a essa soggia¬ 
cente rimaneva fondamentalmente 


oscura. Il lavoro d’analisi corrente- 
mente eseguito in teoria della confer¬ 
ma e in logica induttiva sta tentando 
di porre rimedio a questa situazione. 

C’è una grande divergenza di opi¬ 
nioni circa la via migliore da seguire 
nel cercare di trattare i problemi del¬ 
la conferma. Sono due gli espedienti 
che mi sembra offrano una considere¬ 
vole speranza di aiuto. Il primo di que¬ 
sti è il teorema di Bayes, un semplice 


teorema del calcolo matematico delle 
probabilità (si veda l’illustrazione in 
basso a pagina 108). Il teorema di Bayes 
è spesso chiamato « regola della pro¬ 
babilità inversa ». Data la probabilità 
che una certa evidenza varrebbe se do¬ 
vesse valere un’ipotesi particolare (e 
date anche altre probabilità), il teore¬ 
ma di Bayes ci consente di calcolare 
la probabilità che l’ipotesi sia vera una 
volta scoperta la suddetta evidenza. In 
certo casi almeno esso può essere usa¬ 
to per accertare la probabilità che fos¬ 
se operante qualche causa particolare, 
dato il verificarsi di un certo effetto. 

Il teorema di Bayes è stato utilizza¬ 
to largamente in anni recenti dagli 
studiosi di statistica che si sono auto- 
definiti bayesiani, in particolare negli 
ultimi lavori di L.J. Savage. Il teore¬ 
ma di Bayes ha fornito alla teoria del¬ 
la conferma uno schema che sembra 
assai più adeguato all’inferenza scien¬ 
tifica di quanto non possa mai sperare 
di esserlo la fallacia dell’affermare il 
conseguente. 

Jl secondo espediente nasce da un 

chiaro riconoscimento del concetto 
incrementale di conferma in quanto 
opposto al concetto assoluto. La con¬ 
ferma incrementale chiama in causa 
il cambiamento di probabilità, che è 
fondamentalmente un concetto di ri¬ 
levanza probabilistica. È cosi aperta la 
strada alla definizione di una misura di 
rilevanza basata sulla caratteristica 
matematica della probabilità, per mez¬ 
zo della quale si può studiare la con¬ 
ferma incrementale in modo sistema¬ 
tico e preciso. Tale misura è stata de¬ 
finita ed elaborata da Rudolf Carnap 
nel 1950, ma sembra che a essa non 
sia stata prestata sufficiente attenzione. 
Il problema della polmonite e i due 
paradossi dell’annichilazione sono stati 
individuati sulla piattaforma della trat¬ 
tazione carnapiana della rilevanza, e 
credo che un ulteriore sforzo di atten¬ 
zione verso la nozione formale di con¬ 
ferma incrementale priverà questi 
esempi della loro apparenza parados¬ 
sale. 

Allo stadio attuale di sviluppo gli 
studi di teoria della conferma e di lo¬ 
gica induttiva hanno prodotto più pa¬ 
radossi ed enigmi che non soluzioni 
convincenti o largamente accettate di 
problemi fondamentali. Altre ricerche 
su questi problemi dovrebbero, tutta¬ 
via, produrre notevoli approfondimen¬ 
ti nella logica delle scienze empiriche, 
allo stesso modo in cui gli studi sui 
fondamenti della matematica sono sta¬ 
ti ripagati dai notevoli progressi con¬ 
seguiti nella comprensione della logica 
di questa disciplina. 





La congiunzione di due conferme può refutare una ipotesi. Se decade l’atomo A (o fi), 
la probabilità che emetta un elettrone è 0,2 e quella che emetta un positone è 0,1. La 
probabilità dell’annichilazione, che si verificherà se un atomo emette un elettrone e 
l’altro un positone, è perciò 0,2 X 0,1 + 0,1 X 0,2, ossia 0,04. Se lo scienziato A osserva 
soltanto che l’atomo A ha emesso un elettrone, considera che la probabilità dell’anni- 
chilazione si è accresciuta a 0,1 (la probabilità che l’atomo B emetta un positone). Lo 
scienziato B, osservando soltanto che l’atomo B ha emesso un elettrone, registra lo stes¬ 
so aumento di probabilità. La congiunzione di ambedue le osservazioni (corrispondente 
all’emissione di due elettroni), tuttavia, significa che non può esserci annichilazione. 
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Problemi non risolti 
dell’aritmetica 

E nella natura dellaritmetica porsi più problemi di quanti non ne 
possa risolvere. L'aver dimostrato che ci sono problemi che è impossibile 
risolvere è una delle grandi conquiste della logica matematica 


C i sono problemi aritmetici la cui 
comprensione è alla portata di 
un ragazzo di dieci anni e che 
ciononostante sono rimasti insoluti per 
decine, centinaia, anche migliaia di an¬ 
ni. Per molto tempo si è pensato che, 
se un problema di aritmetica si poteva 
formulare con precisione, solo un di¬ 
fetto di capacità poteva essere d’osta¬ 
colo alla sua soluzione; se un proble¬ 
ma poi restava insoluto, si pensava che 
una soluzione si sarebbe alla fine tro¬ 
vata grazie all’applicazione di qualche 
nuovo metodo, o all’applicazione più 
avveduta di qualche metodo già usato. 
La metalogica, un settore della logica 
matematica contemporanea, ha chiari¬ 
to che il continuo scacco subito nei ten¬ 
tativi di soluzione di alcuni problemi 
matematici non risolti può essere do¬ 
vuto non tanto a scarsa abilità quanto 
a limitazioni connaturate alle capacità 
degli uomini e delle macchine. 

È stato attraverso un affinamento di 
alcune tendenze già vive tra i greci 
che la logica matematica è venuta alla 
luce, negli ultimi anni del secolo XIX 
e nei primi del secolo XX. Quindi il 
nostro discorso deve cominciare con 
Aristotele, l’inventore della logica, che 
diede vita a questa scienza in risposta 
a una duplice istanza, filosofica e ma¬ 
tematica insieme. Il problema filosofi¬ 
co nasceva dalla necessità di rispondere 
alla estrema varietà di argomentazioni 
che si trovava a dover affrontare. Ta- 
lete aveva sostenuto che la sostanza 
fondamentale del mondo è l’acqua, 
Anassimandro che non è una cosa par¬ 
ticolare ma qualcosa di indeterminato; 
Eraclito aveva sostenuto che tutte le 
cose sono in movimento, Parmenide 
che non lo è nessuna; Protagora aveva 
affermato che i giudizi etici sono rela¬ 
tivi, Socrate che non lo sono, e cosi 
via. Aristotele doveva anche essere al¬ 
lenato a trattare con paradossi, come il 
paradosso zenoniano di Achille e della 


di Howard DeLong 

tartaruga, e con argomentazioni semi¬ 
legali del tipo di quelle che si dice sia¬ 
no intercorse tra Protagora ed Euatlo 
(si vedano le figure a pagina 113 e a pa¬ 
gina 116). Si sentiva la necessità di 
porre dei principi generali in grado di 
fornire metodi sistematici per distingue¬ 
re le argomentazioni corrette. 

La matematica, e specificamente la 
geometria, procurò un motivo ancor 
più valido per promuovere una ricerca 


nel campo della logica: la scuola pita¬ 
gorica aveva scoperto 1’esistenza del¬ 
le grandezze incommensurabili. Essere 
commensurabile significa avere una mi¬ 
sura comune, ed è ovvio che l’unità è 
la misura comune di tutti i numeri na¬ 
turali (1, 2, 3 e cosi via). Un numero 
era inteso come una collezione compo¬ 
sta di unità. L’unità aritmetica era pen¬ 
sata come indivisibile. Frazioni come 
1/2 o 2/3 erano intese non come par- 



Un’argomentazione semilegale si presentò quando Protagora si impegnò a insegnare 
retorica a Euatlo e a ricevere la seconda metà dell’onorario, solo dopo che Euatlo 
avesse vinto la sua prima causa. Quando Euatlo ritardò l’inizio della sua attività foren¬ 
se, Protagora fece causa per ottenere il suo onorario. I due avvocati discussero cosi. 
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ti di una unità ma sempre come una 
unità presa da due, due prese da tre 
e via dicendo. Su questa base doveva 
probabilmente sembrare ovvio che, da¬ 
te due lunghezze qualsiasi, dovesse es¬ 
serci una unità geometrica così piccola 
da essere sottomultipla di ambedue le 
lunghezze. In tal caso in qualsiasi cop¬ 
pia di lunghezze queste starebbero fra 
loro in una determinata proporzione: 
la prima starebbe alla seconda come x 
sta a y, dove x è il numero delle unità 
geometriche della prima lunghezza e y 
quello della seconda. 

Data la credenza quasi religiosa dei 
pitagorici nel numero come principio 
unificante deU’aritmetica, della geome¬ 
tria, della cosmologia e della filosofia, 
la loro scoperta delle grandezze incom¬ 
mensurabili deve essere stato uno choc, 
il primo dei molti conflitti tra religione 
e scienza nel mondo occidentale. La 
scoperta scaturì sotto forma di una di¬ 
mostrazione della incommensurabilità 
del lato e della diagonale di un qua¬ 
drato. Altri esempi di dimostrazioni 
che urtarono contro credenze radicate 
sulla base di ragioni diverse sollevaro¬ 
no la questione della natura esatta e 
della attendibilità delle dimostrazioni. 

La logica aristotelica 

È stato quindi in risposta a conside¬ 
razioni tanto filosofiche quanto mate¬ 
matiche che Aristotele creò la logica. 
Egli fissò la sua attenzione su quattro 
tipi generali di proposizione: la univer¬ 
sale affermativa, la universale negativa, 
la particolare affermativa e la partico¬ 
lare negativa. Esempi di ciascuna sono, 
nell’ordine: « Tutti gli uomini sono 
bianchi », « Nessun uomo è bianco », 
« Qualche uomo è bianco » e « Qual¬ 
che uomo non è bianco ». Aristotele si 
pose il problema di sapere quali ragio¬ 
namenti sono validi se due proposizio¬ 
ni del genere con un termine in comu¬ 
ne sono assunte come vere. Il risultato 
fu la famosa teoria del sillogismo. Per 
esempio, da « Tutti gli uomini sono 
bianchi » e « Qualche vittima del can¬ 
cro non è bianca » c’è una sola con¬ 
clusione valida da ricavare: « Qualche 
vittima del cancro non è uomo ». Le 
tre proposizioni insieme costituiscono 
un sillogismo. La logica era intesa co¬ 
me uno studio della connessione tra 
premesse e conclusione. In altre paro¬ 
le, asserire che un ragionamento è va¬ 
lido significava asserire non che le pre¬ 
messe sono vere, ma piuttosto che se 
le premesse sono vere, allora la conclu¬ 
sione è pure vera. Aristotele si spinse 
oltre e considerò una « dimostrazio¬ 
ne » (questa era la sua terminologia) 
come un sillogismo valido con premes¬ 
se necessariamente vere. Egli diede co¬ 


sì una risposta al problema di sapere 
quando si ha dimostrazione in geome¬ 
tria: una proposizione è dimostrata in 
geometria se è la conclusione di una 
dimostrazione. Secondo Aristotele non 
tutta la conoscenza è dimostrativa. Bi¬ 
sogna partire da verità autoevidenti 
(che non sono oggetto di dimostrazio¬ 
ne) e procedere sillogisticamente alle 
conclusioni. In questa concezione sta 
il germe del metodo assiomatico tradi¬ 
zionale. 

L’esempio classico di questo metodo 
sono gli Elementi di Euclide, che data¬ 
no a poco dopo l’epoca di Aristotele. 
Euclide apre la sua opera con una se¬ 
rie di 23 definizioni, 5 postulati e 5 
« nozioni comuni », e da questi dimo¬ 
stra un gran numero di teoremi. Per le 
sue distinzioni tra queste quattro cate¬ 
gorie (definizioni, postulati, nozioni co¬ 
muni e teoremi) e per aver esibito un 
pari numero di dimostrazioni, Euclide 
occupa un posto importante nello svi¬ 
luppo del metodo assiomatico (si veda 
l’illustrazione alle pagine 118 e 119). Il 


metodo di Euclide e le sue applicazio¬ 
ni contenevano dei difetti, ma così sot¬ 
tili da sfuggire all’attenzione di tutti, 
o quasi, per 2000 anni. 

Gli antichi greci fecero qualcos’al¬ 
tro, in geometria, che ebbe una funzio¬ 
ne importante nello sviluppo della lo¬ 
gica matematica: essi si posero proble¬ 
mi geometrici che loro stessi non erano 
in grado di risolvere. I più celebri era¬ 
no quelli della duplicazione del cubo, 
della quadratura del cerchio e della 
trisezione di un angolo (arbitrario). In 
ciascuno dei casi si trattava di eseguire 
una costruzione esatta servendosi solo 
di riga e compasso. I geometri greci 
non riuscirono a risolvere questi pro¬ 
blemi sotto tale condizione limitativa, 
anche se li risolsero usando metodi più 
complessi. A quanto pare alcuni dei 
greci antichi erano convinti della im¬ 
possibilità di risolvere i problemi sotto 
la condizione che si è formulata, ma 
nessuno, per quanto ne so, concepì l’i¬ 
dea che l’impossibilità potesse essere 
oggetto di dimostrazione. Era lasciato 



In questo disegno di Bernarda Brvson filosofi e matematici meditano sull’insolubilità. 
Aristotele (384-322 a.C.) fondò la logica allo scopo di affrontare problemi come quelli 
posti da Pitagora (580-500 a.C. ca.) e da Zenone (490-430 a.C. ca.); Euclide applicò 
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ai posteri il compito di decidere se l’in¬ 
successo nel risolvere questi problemi 
sotto la condizione limitativa fosse do¬ 
vuto a mancanza di abilità oppure alla 
natura dei problemi stessi. Fu solo nel 
XIX secolo che si dimostrò che tali 
costruzioni erano impossibili con riga e 
compasso solamente. 

Sfide alla logica 

Circa nello stesso periodo divennero 
evidenti le manchevolezze della logica 
aristotelica. Lo divennero perché lo svi¬ 
luppo della geometria non-euclidea, la 
teoria degli insiemi e la comparsa di 
nuovi e inquietanti paradossi portarono 
alla luce problemi di logica sistematici 
e fondamentali a cui né l’intuizione né 
la logica aristotelica potevano dare una 
risposta. 

Consideriamo per prima cosa la geo¬ 
metria non-euclidea. Karl Friedrich 
Gauss e Nikolaj Ivanovic Lobacevskij, 
tra gli altri, scoprirono indipendente¬ 
mente una geometria differente da quel¬ 


la di Euclide, una geometria cioè in 
cui non vale la relazione pitagorica. 
Essi decisero che solo l’osservazione 
empirica e l’esperimento potevano de¬ 
terminare quale era la vera geometria, 
e con la scoperta di diverse geometrie 
questo atteggiamento si diffuse larga¬ 
mente. Esso portò a respingere la con¬ 
cezione del geometra come artefice di 
« dimostrazioni » nel senso aristotelico; 
il compito del geometra doveva essere 
quello di trovare connessioni logiche 
tra proposizioni geometriche, e non 
quello di determinare se erano vere le 
assunzioni di partenza. Era indispensa¬ 
bile tuttavia che gli assiomi fossero con¬ 
sistenti, perché una collezione inconsi¬ 
stente di enunciati non è possibile che 
sia vera. I matematici del secolo XIX 
svilupparono i mezzi per provare che 
se un sistema (poniamo la geometria 
euclidea) è consistente, allora un altro 
(poniamo qualche geometria non-eucli¬ 
dea) è pure consistente. Con ciò resta¬ 
va aperta la questione di come si po¬ 
tesse dimostrare in assoluto la consi¬ 


stenza di un sistema. La geometria non- 
-euclidea diveniva così essenziale allo 
sviluppo della matematica per almeno 
due riguardi. Essa centrava l’attenzione 
sul compito del matematico come sco¬ 
pritore di connessioni logiche, e solle¬ 
vava il problema di come dimostrare 
la consistenza di una collezione di 
enunciati prescindendo dalla verità de¬ 
gli enunciati stessi. 

La teoria degli insiemi fornì un’altra 
spinta alla crescita della logica mate¬ 
matica. Georg Cantor definì un insieme 
come una qualunque collezione costi¬ 
tuente un tutto di oggetti definiti e di¬ 
stinti della nostra intuizione o del no¬ 
stro pensiero. Questo concetto molto 
astratto di insieme è applicabile a ge¬ 
neri diversi di cose come un insieme 
di scacchi o l’insieme dei numeri na¬ 
turali o l’insieme di tutti gli insiemi di 
piatti. La teoria degli insiemi si dimo¬ 
strò estremamente feconda. Cantor riu¬ 
scì a dimostrare che il concetto di in¬ 
finito è strutturato, e che proprio come 
gli insiemi finiti possono avere dimen¬ 
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il metodo assiomatico di Aristotele alla geometria. Gauss (1777- 
-1855) e N.I. Lobacevskij (1793-1856) diedero sviluppo alla geo¬ 
metria non-euclidea. Cantor (1845-1918) è il fondatore della teoria 


degli insiemi, all’interno della quale Russell (1872-1970) scoprì un 
paradosso. Kurt Godei (1906-1978) e Church (1903) sono autori di 
teoremi in cui viene provata l’insolubilità di alcuni problemi. 
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sioni differenti, così ci possono essere 
insiemi infiniti con dimensioni differen¬ 
ti. Per esempio, proprio come l’insieme 
delle capitali di stato è grande quanto 
l’insieme degli stati ma più piccolo del¬ 
l’insieme dei senatori degli USA così, 
ha dimostrato Cantor, l’insieme dei nu¬ 
meri naturali è grande quanto l’insieme 
dei numeri razionali (rapporti di interi) 
ma piu piccolo dell’insieme dei numeri 
reali (decimali). Nel ragionare su insie¬ 
mi infiniti bisogna essere cauti, in quan¬ 
to la logica che vale per insiemi finiti 
non si applica necessariamente a quelli 
infiniti. Per esempio si può dimostrare 
che ci sono tanti numeri pari quanti 
sono i numeri naturali mettendoli in 
coi rispondenza biunivoca (1-2, 2-4, 3-6, 
Con ciò si contraddice l’as¬ 
sioma euclideo secondo il quale il tutto 
è maggiore della parte. 

La teoria degli insiemi sembrò fon¬ 
damentale a tal punto ohe per qualche 
tempo si ebbe la sensazione che tutta 
la matematica potesse essere fondata 
su di essa. Questa fiducia fu scossa dal¬ 
la scoperta che nella teoria degli insie¬ 


mi si presentavano delle contraddizioni 
logiche. La piu semplice e famosa di 
queste è il paradosso, scoperto da Ber¬ 
trand Russell nel 1902, relativo all’in¬ 
sieme di tutti gli insiemi che non so¬ 
no membri di se stessi. Lo spirito del¬ 
l’antinomia si può rendere con il para¬ 
dosso del postino (si veda l’illustrazione 
a pagina 120), ma è importante distin¬ 
guere la volgarizzazione dalla formula¬ 
zione di Russell. La volgarizzazione 
non è in realtà un paradosso perché 
possiamo facilmente risolverla, per 
esempio negando che tale postino possa 
esistere (oppure, se ne esiste uno, che 
questo sia abitante del paese; o se lo 
è, che riceva posta, e così via). Lo stes¬ 
so non succede con il paradosso di 
Russell: tutte le . assunzioni di questo 
sembrano infatti necessariamente vere 
e tutti i modi per evitarlo sembrano 
avere conseguenze logicamente indesi¬ 
derabili. 

La teoria degli insiemi quindi è stata 
importante ai fini dello sviluppo della 
logica matematica da due punti di vi¬ 
sta: ha introdotto nella pratica comune 


ragionamenti relativi a collezioni infi¬ 
nite e ha provato che la « logica » che 
è adatta per collezioni finite non si ap¬ 
plica necessariamente alle collezioni in¬ 
finite. Per di più il paradosso di Rus¬ 
sell, insieme a molti altri paradossi, 
sottolineava la necessità di una attenta 
indagine su quella che era la radice de¬ 
gli errori logici. 

Logica matematica 

Dunque, la rinascita delle indagini 
logiche che ebbe luogo nel XIX secolo 
e agli inizi del XX fu provocata da 
considerazioni analoghe a quelle che 
fecero nascere la logica aristotelica: 
cioè l’esigenza di affrontare dei para¬ 
dossi e la questione della dimostrazio¬ 
ne in matematica. Tanto la geometria 
non-euclidea quanto la teoria degli in¬ 
siemi si esprimevano in affermazioni 
in contrasto con le credenze comune¬ 
mente accettate. La logica aristotelica 
era inadeguata a risolvere questi pro¬ 
blemi che andavano quindi affrontati 
secondo un approccio diverso. La nuo- 



Un paradosso di Zenone afferma che il piè veloce Achille non può AB. Nel tempo in cui Achille raggiunge B la tartaruga sarà 

raggiungere la tartaruga. Alla tartaruga sia dato un vantaggio in C; quando Achille sarà in C, la tartaruga sarà in D, e cosi via. 
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PROBLEMI 
NON RISOLTI 
DAGLI 
ANTICHI 
GRECI 


Duplicazione del cubo: costruire 
un cubo con volume doppio di un 
cubo dato. 


Quadratura del cerchio: costruire 
un quadrato con un'area uguale 
a quella di un cerchio dato. 


Trisezione di un angolo (arbitrario): 

dividere un angolo arbitrario 
in tre parti uguali. 


Ad/ 

? 


7 




7 


A B 

2 x (volume di A) = volume di B 



A B 


area di A = area di B 



a = P = Y 


PROBLEMI 
NON RISOLTI 
DELLA 
ARITMETICA 


Problema dei numeri perfetti. Un 

numero perfetto è un numero 
naturale uguale alla somma 
dei suoi divisori (escluso se stesso). 
Per esempio 6, il più piccolo 
numero perfetto, è uguale a 1+2+3. 

I sei numeri perfetti successivi 
sono, nell’ordine, 28, 496, 8128, 

33 550 336, 8 589 869 056, 137 438 691 328. 
Problema: determinare se c’è un 
numero finito o infinito di 
numeri perfetti. 


Congettura di Goldbach. Nel 1742 
Goldbach avanzò l’ipotesi che ogni 
numero naturale pari maggiore di 2 
fosse la somma di due numeri primi 
(un numero primo è un numero 
naturale maggiore di 1 divisibile solo 
per se stesso e per l’unità). Per 
esempio, 20 = 7 + 13, 88 = 5 + 83, 

7000 = 3 + 6997. Problema: 
dimostrare la congettura o trovare 
un numero naturale pari che non 
possa essere rappresentato come 
somma di due primi. 


Ultimo teorema di Fermat. Fermat 
disse di avere una dimostrazione 
(che non è mai stata trovata) 
dell’enunciato che per tutti i numeri 
naturali x, y, z, n, 

X n + 2 -}- yn+2 jn+1 

Tutte le altre proposizioni 
matematiche di Fermat sono state 
finora o confermate o refutate. 

Di qui il nome di « ultimo teorema ». 


Sono qui elencati alcuni problemi non risolti di geometria e 
li aritmetica. Per gli antichi geometri greci il problema era 
quello di fare le costruzioni con riga e compasso solamente. Nel 


secolo XIX si dimostrò che questi mezzi sono insufficienti. 
I problemi aritmetici, d’altro canto, possono essere non risolti 
perché tutti i mezzi disponibili sono inadeguati a risolverli. 


va strategia passò attraverso l’impiego 
di metodi matematici e generò una nuo¬ 
va disciplina: la logica matematica. 

Furono due i metodi matematici che 
trasformarono la logica in una nuova 
disciplina. Il primo fu il metodo alge¬ 
brico, in cui le relazioni tra entità ma¬ 
tematiche sono rispecchiate da relazio¬ 
ni intercorrenti tra i simboli di queste 
entità, cosicché si possono scoprire nuo¬ 
ve relazioni tra entità matematiche ma¬ 
nipolando i simboli di queste seconde 
certe regole. Il secondo fu il metodo 
assiomatico, non quello di Euclide ma 
una sua revisione; per distinguerlo dal 
metodo di Euclide va spesso sotto il 
nome di metodo assiomatico formale. 

Il metodo assiomatico formale diffe¬ 
risce da quello di Euclide per quanto 
riguarda la definizione e la esplicitazio- 
ne di simboli, grammatica e logica 
(si veda l’illustrazione a pagina 118 e 
119). Il discorso che Aristotele fa¬ 
ceva per le proposizioni è applicabile 
anche alle definizioni: proprio come ci 
sono alcune proposizioni che non si 
possono dimostrare (altrimenti si ca¬ 
drebbe in un regresso all’infinito), co¬ 
si ci devono essere alcuni termini che 
non si possono definire. La analogia si 
spinse oltre. Proprio come tutte le pro¬ 
posizioni devono essere dimostrate in 
termini di proposizioni non dimostrate, 
cosi tutti i termini devono essere defi¬ 
niti in termini di termini indefiniti. Le 
definizioni sono perciò superflue da un 
punto di vista teorico; esse servono so¬ 
lo a titolo di abbreviazioni. 

Gli assiomi di un sistema formale 
possono contenere solo simboli non de¬ 


finiti. Cosi, in un certo senso, si può 
dire che gli assiomi non vertono su 
nulla; il matematico che dimostra teo¬ 
remi non fa riferimento ai significati 
possibili di termini indefiniti. In un al¬ 
tro senso invece gli assiomi vertono su 
qualunque insieme di oggetti tale da 
rendere veri gli assiomi stessi; per 
esempio gli assiomi di' un particolare 
sistema formale potrebbero essere veri 
quando vengono applicati a numeri na¬ 
turali. Il fatto che i termini indefiniti 
negli assiomi si applichino a molte co¬ 
se differenti si potrebbe pensare come 
un difetto del metodo assiomatico for¬ 
male. Al contrario esso costituisce la 
grande forza e versatilità del metodo, 
in quanto rende possibile ricavare una 
volta per tutte un largo corpo di teo¬ 
remi veri per qualunque insieme di og¬ 
getti per cui sono veri gli assiomi. 

Per farsi un’idea di questa caratteri¬ 
stica, si consideri un gioco con nove 
carte - l’asso e dal due al nove - di¬ 
sposte scoperte su un tavolo tra due 
giocatori. I giocatori a turno prendono 
una carta, e ciascuno dei giocatori cer¬ 
ca di essere il primo ad avere tre carte 
la cui somma è quindici. Il gioco è 
strutturalmente simile al « filetto ». La 
analogia non è ovvia finché non si im¬ 
magina di disporre le carte in una 
scacchiera per il gioco del « filetto » 
costruita in modo tale che, invece di 
prendere una carta, i giocatori possa¬ 
no segnare le carte alternativamente 
con X o O (si veda l’illustrazione a pagi¬ 
na 121). Allora è facile rendersi conto 
che per ciascuna partita con le carte 
c’è un corrispondente « filetto » e vi¬ 


ceversa, ricordando che la scacchiera 
permette a chiunque conosca la strate¬ 
gia di un gioco di applicarla all’altro 
gioco. Questo è, in effetti, quanto fa 
il matematico che studia un sistema 
formale: egli studia la struttura di am¬ 
bedue i « giochi » e deriva affermazio¬ 
ni descriventi la struttura ohe sono ve¬ 
re per entrambi i « giochi ». 

Un sistema formale ha qualche ana¬ 
logia con un linguaggio naturale. I suoi 
simboli corrispondono a lettere dell’al¬ 
fabeto, segni di punteggiatura, numera¬ 
li e cosi via; le regole di formazione 
corrispondono alle regole grammatica- 
li di un linguaggio naturale; le regole 
di trasformazione corrispondono a va¬ 
rie operazioni che qualunque parlante 
può compiere sul linguaggio, come il 
convertire un enunciato da attivo in 
passivo. Per gli assiomi questa corri¬ 
spondenza non è immediatamente iden¬ 
tificabile nel linguaggio naturale, anche 
se si potrebbero considerare paragona¬ 
bili a enunciati come « Tutto ciò che 
è, è » oppure «A è A ». Ci sono na¬ 
turalmente differenze notevoli tra lin¬ 
guaggi naturali e sistemi formali, ma 
l’analogia è abbastanza stretta sicché 
quando i sistemi formali sono interpre¬ 
tati spesso si dà loro il nome di lin¬ 
guaggi artificiali. 

Quando agli assiomi sono applicate 
delle regole di trasformazione, ciò che 
si ottiene è un teorema. L’esibizione 
della applicazione delle regole è una 
dimostrazione. Piu esplicitamente, una 
dimostrazione è una sequenza finita di 
enunciati formali tali che ciascuno de¬ 
gli enunciati formali è un assioma o 
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segue da uno o più enunciati formali 
precedenti mediante applicazione di 
una regola di trasformazione. L’ultima 
riga della dimostrazione è un teorema. 
Le regole di trasformazione devono es¬ 
sere tali da rendere puramente mecca¬ 
nico il procedimento di determinare se 
una data sequenza di enunciati formali 
è una dimostrazione o no. 

Proprietà dei sistemi formali 

Si consideri un insieme di oggetti che 
siano indipendenti da qualche sistema 
formale del tipo visto. Noi diamo una 
interpretazione al sistema assegnando 
ai simboli elementi di questo insieme in 
maniera tale che gli assiomi siano veri 
per gli elementi dell’insieme di oggetti 
considerato. Questo insieme di oggetti 
in tal caso è detto un modello per il 
sistema. Il linguaggio (l’italiano) in cui 
noi poniamo e risolviamo problemi in¬ 
torno al sistema è il metalinguaggio. Il 
sistema formale è il linguaggio-oggetto, 
in quanto è l’oggetto del nostro discor¬ 
so. Per esempio, se diciamo « Nel si¬ 
stema S possiamo dimostrare l’enuncia¬ 
to formale ’1 + 1 = 2’», stiamo facendo 
una affermazione nel metalinguaggio 
intorno a « 1 + 1=2 », che è un enun¬ 
ciato espresso nel linguaggio-oggetto. 
Questo è il motivo per cui l’analisi del¬ 
le proprietà formali dei sistemi ha pre¬ 
so il nome di metalogica. 

Si consideri ora un sistema formale 
(chiamiamolo A +) costituito con l’o¬ 
biettivo di formalizzare le regole per 
l’addizione dei numeri naturali. È pos¬ 
sibile dimostrare che tale sistema è 
« consistente », cioè che è impossibile 
che qualunque suo teorema sia la ne¬ 
gazione di qualche altro suo teorema. 
Per esempio, una sola dimostrazione 
ci assicura che se «1 + 1=2» è un 
teorema, allora «1 + 1 + 2» (« non è 
uguale a 2 ») non sarà un teorema. Si 
può anche provare che A + è « cor¬ 
retto », cioè che ogni teorema è vero 
quando è applicato ai numeri naturali. 
Inoltre, si potrà dimostrare che A + è 
« completo » : cioè a dire, ogni verità 
circa i numeri naturali esprimibile nel 
simbolismo del sistema è un teorema. 
Infine si può provare che il sistema ha 
una « procedura di decisione », cioè che 
esiste un metodo con il quale ogni pro¬ 
blema esprimibile in A + può essere 
risolto in un numero finito di passi. Le 
procedure di decisione - talvolta chia¬ 
mate algoritmi - sono comuni nella 
pratica matematica. Per esempio, la 
tecnica della divisione rappresenta una 
procedura di decisione per il predica¬ 
to « x è divisibile per y », dove x ed y 
possono essere numeri qualsivoglia (un 
predicato è un enunciato aperto: un 
enunciato cioè che può essere comple¬ 


tato sostituendo nomi alle sue variabi¬ 
li). Anche se questo predicato rappre¬ 
senta un numero infinito di problemi, 
questi problemi sono essenzialmente si¬ 
mili, cosicché chiunque abbia dimesti¬ 
chezza con la divisione ha un algoritmo 
con cui è in grado di risolvere in un 
lasso di tempo finito qualunque proble¬ 
ma di divisione sottopostogli, senza bi¬ 
sogno di particolari intuizioni o capa¬ 
cità personali. 

L’esistenza di una procedura di de¬ 
cisione fa scemare l’interesse teoretico 
per una determinata area. Anche se è 
stato compiuto effettivamente solo un 
numero finito di divisioni, nessuno ha 
più interesse per le divisioni; e i pro¬ 
blemi che restano in questo campo so¬ 
no di indole pratica. L’esistenza di una 
procedura di decisione per un sistema 
formale risolve in un certo senso i pro¬ 
blemi teorici per tutti i modelli del si¬ 
stema. II successo incontrato con un 
certo numero di sistemi portò verso il 
1930 alla speranza, per non dire alla 
aspettativa, che sistemi espressivamente 
più potenti di A + si potessero dimo¬ 
strare consistenti, corretti, completi e 
in possesso di una procedura di de¬ 
cisione. 

In particolare si nutrì la speranza che 
un sistema « totale » per l’aritmetica — 
chiamiamolo A — si potesse dimostra¬ 
re in possesso di queste proprietà (per 
« sistema totale » si intende un siste¬ 
ma esprimente l’addizione e la molti¬ 
plicazione di numeri naturali e tutte 
le operazioni definibili in termini di ad-’ 
dizione e moltiplicazione, come la di¬ 
visione). Tale dimostrazione avrebbe 
permesso ai matematici di risolvere i 
problemi teorici dell’aritmetica; ed era 
concepibile persino che tutti i problemi 
della matematica si potessero risolvere 
in modo analogo. 

È stata una delle grandi conquiste 
dei logici matematici l’aver provato 
che a queste speranze non si poteva 
dare appagamento. Come esempio del 
modo in cui si è raggiunto questo risul¬ 
tato discuterò il teorema di incomple¬ 
tezza scoperto da Kurt Godei nel 1931 
e un teorema presentato da Alonzo 
Ohurch nel 1936. Questi teoremi e al¬ 
cuni altri dello stesso tipo ricevono ta¬ 
lora il nome di teoremi limitativi, in 
quanto sembrano esprimere delle limi¬ 
tazioni delle facoltà umane. 

Il teorema di Godei 

L’enunciazione dettagliata del teore¬ 
ma di incompletezza di Godei è diffìci¬ 
le, ed è necessario un bagaglio ragguar¬ 
devole di conoscenze per intendere la 
dimostrazione nel suo complesso. Lo 
spirito della dimostrazione si può co¬ 
munque rendere schematicamente (si 


METODO ASSIOMATICO TRADIZIONALE 


DESCRIZIONE 


[Simboli]. Non elencati esplicitamente; presumi¬ 
bilmente comprendevano simboli ordinari presi 
dal linguaggio naturale. 


[Regole di formazione]. Non enunciate esplicita¬ 
mente; presumibilmente comprendevano le regole 
grammaticali ordinarie del linguaggio naturale. 


Definizioni. Le definizioni erano intese come 
obiettive e vere e dovevano includere tutti i ter¬ 
mini geometrici fondamentali. 


Postulati. Intesi come verità e costruzioni auto¬ 
evidenti che si applicano specificamente alla 
geometria. 


Nozioni comuni. Verità autoevidenti che si po¬ 
trebbero anche applicare ad altre scienze, per 
esempio dell'aritmetica. 


[Regole di inferenza]. Non enunciate esplicita¬ 
mente, presumibilmente comprendevano le infe¬ 
renze intuitive ordinarie come se p, e p impli¬ 
ca q, allora q ». 


Teoremi. Verità e costruzioni non evidenti che si 
dovevano dimostrare in modo tale da allontanare 
ogni dubbio legittimo (cioè autorizzando a com¬ 
parire in una dimostrazione solo assunzioni con¬ 
tenute nelle definizioni, nei postulati, nelle no¬ 
zioni comuni, e teoremi già dimostrati). 


Il metodo assiomatico formale, insieme al 
metodo algebrico, ha trasformato la logica 


veda l’illustrazione a pagina 122). Si 
consideri il « paradosso del mentitore », 
formulato dai greci antichi, che si può 
riformulare come il problema di deci¬ 
dere se l’enunciato: « Questo enunciato 
non è vero » è o no vero. Ne nasce una 
contraddizione tanto assumendo che 
l’enunciato del mentitore è vero quan¬ 
to assumendo che l’enunciato è falso, 
da cui segue che qualunque sistema 
formale in cui esso è esprimibile è in¬ 
consistente. Si supponga ora che il po¬ 
tere espressivo di un certo sistema for¬ 
male sia tale da rendere esprimibile 
non « vero » o « falso » ma « dimo¬ 
strabile » o « indimostrabile ». L’analo¬ 
go dell’enunciato del mentitore sareb¬ 
be allora « Questo enunciato non è di¬ 
mostrabile». Si chiami P questo enun¬ 
ciato. L’esistenza di P non rende in¬ 
consistente il sistema, ma produce qual¬ 
cosa di sconcertante: P infatti è vero 
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(APPLICATO ALLA GEOMETRIA) 

METODO ASSIOMATICO FORMALE (APPLICATO ALL’ARITMETICA) 

ESEMPI 

DESCRIZIONE 

ESEMPI 


Elenco di simboli. Deve comprendere tutti i sim¬ 
boli da impiegare nel sistema. Per esempio, x e 
y sono variabili individuali (cioè, possono stare 
per qualunque elemento del modello), mentre p 
e q sono variabili proposizionali (cioè possono 
stare per qualunque proposizione). 

+ = 0 ( , ) 

x y p q 


Regole di formazione. Indicano i modi in cui i 
simboli si possono legittimamente combinare per 
generare enunciati formali. Per esempio «x = x» 
è un enunciato formale mentre «x= =» non lo è. 

Se u e v sono variabili individuali, u = v è un 
enunciato formale. 

jnto è ciò che non ha parti. 

nea è lunghezza senza larghezza. 

nea retta è quella che giace ugualmente 

spetto ai suoi punti. 

[Definizioni]. Le definizioni sono eliminate in 
quanto da un punto di vista teorico non assolvo¬ 
no alcuna funzione. La sola utilità che presenta¬ 
no è tachigrafica. 


a qualsiasi punto a ogni punto si può 
indurre una linea retta. 

può descrivere un cerchio con qualunque 
mtro e qualunque raggio 
jtti gli angoli retti sono uguali tra loro. 

Assiemi (aritmetici). Un elenco di enunciati for¬ 
mali dai quali prendiamo le mosse. Questi assio¬ 
mi sono destinati a essere interpretati come 
enunciati aritmetici, anche set non si fa riferi¬ 
mento a questo nello sviluppare il sistema. 

(x + X 0) = x 
(x . 0) = 0 

ose che sono uguali alla stessa cosa sono 
guali anche tra loro. 

e cose uguali sono aggiunte a cose uguali, 
totalità sono uguali, 
tutto è maggiore delle parti. 

Assiomi (logici). Una volta interpretati, diventano 
assunzioni logiche. L’esempio a destra significa: 
«s epe vero, allora, se q è vero, p è vero». 

(p =3 (q => p)) 


Regole di trasformazione. Regole con cui mani¬ 
poliamo enunciati formali per produrre nuovi 
enunciati formali. Per esempio, da «x = x» pos¬ 
siamo inferire «0 = 0 ». 

Se r è un enunciato formale contenente una 
variabile individuale, si inferisce l’enunciato 
formale con la variabile individuale 
rimpiazzata da 0. 

u una linea retta finita è possibile costruire 
n triangolo equilatero. 

quadrato deii’ipotenusa di un triangolo 
sttangolo è uguale alia somma 
ei quadrati dei cateti. 

Teoremi. Le ultime righe delle dimostrazioni. Ogni 
riga di una dimostrazione deve o essere un as¬ 
sioma o seguire da una o più righe precedenti 
per applicazione di una regola di trasformazione. 

X = X 

0 = 0 


in logica matematica. Il metodo assiomatico formale applicato al¬ 
l’aritmetica si è sviluppato a partire dal metodo assiomatico tra¬ 


dizionale della geometria, con cui viene qui confrontato. Sono 
descritti gli elementi e di ciascun elemento sono dati esempi. 


se e solo se P non è dimostrabile. 
Quindi possiamo concludere che se ab¬ 
biamo un sistema abbastanza ricco per 
esprimere P, allora viene a saltare la 
comoda relazione tra verità e dimostra¬ 
bilità che si tenta di raggiungere in un 
sistema formale, quella cioè per cui 
l’insieme di enunciati veri sotto qualun¬ 
que interpretazione tale da render veri 
gli assiomi risulta identico all’insieme 
degli enunciati dimostrabili. 

Il teorema di incompletezza di Go¬ 
dei afferma, in parole povere, che per 
qualunque dei sistemi formali noti per 
l’aritmetica ci sono enunciati formali 
analoghi a?, e cioè o il sistema è scor¬ 
retto (dimostra enunciati falsi) o è in¬ 
completo (contiene verità non dimo¬ 
strabili nel sistema). Proprio come il 
« filetto » e il gioco di carte sono strut¬ 
turalmente identici, cosi Godei ha po¬ 
tuto dimostrare che alcuni enunciati 


aritmetici sono strutturalmente identici 
a P. Godei raggiunse questo risultato 
sviluppando un codice (analogo alla 
scacchiera per il gioco del «filetto») per 
mezzo del quale è riuscito a provare 
che affermazioni e ragionamenti intorno 
a un sistema (nel metalinguaggio di 
questo) potevano essere rispecchiati nel 
sistema (nel suo linguaggio-oggetto). 
Non è essenziale ai nostri fini aver di¬ 
mestichezza con i dettagli di questo co¬ 
dice. Basti dire che Godei assegnò un 
numero unico a ciascuno dei simboli, 
enunciati e dimostrazioni in modo tale 
che questi si potevano poi ordinare e 
si poteva parlare, per esempio, del sim¬ 
bolo n. 1 o della dimostrazione n. 15. 

Consideriamo ora l’argomentazione 
di Godei in modo un po’ più dettaglia¬ 
to. Prendiamo come G l’enunciato 
« per qualunque numero naturale x, la 
dimostrazione numero x non è una di¬ 


mostrazione in A dell’enunciato nume¬ 
ro n ». Assumeremo quanto ha prova¬ 
to Godei: e cioè che n può essere scel¬ 
to in modo tale da essere il numero 
dello stesso enunciato G. Se esaminia¬ 
mo da vicino la situazione, ci imbattia¬ 
mo nel curioso fenomeno della u-in- 
completezza (sì veda l’illustrazione a pa¬ 
gina 122). Un sistema formale è w-in- 
completo se contiene una generalizza¬ 
zione di cui è possibile dimostrare ogni 
esempio numerico senza che sia possi¬ 
bile dimostrare la generalizzazione stes¬ 
sa. Ed è proprio relativamente alla 
w-incompletezza che la logica matema¬ 
tica può gettare luce su qualcuno dei 
problemi irrisolti deH’aritmetica. 

Per esempio, nel caso della congettu¬ 
ra di Goldbach (si veda l’illustrazione 
a pagina 117) par ogni dato nume¬ 
ro è un procedimento completamente 
meccanico il determinare se il nume- 
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ro dato è la somma di due numeri pri¬ 
mi. Si supponga, tuttavia, che la con¬ 
gettura di Goldbach, come G, illustri 
la w-incompletezza in A. Potremmo 
allora dimostrare ciascuno dei seguen¬ 
ti enunciati senza poter dimostrare 
l’enunciato generale: « 4 è la somma 
di due numeri primi, 6 è la somma di 
due numeri primi, 8 è la somma di 
due numeri primi... ». In altri termini, 
la ragione per cui la congettura rima¬ 
ne indecisa può essere che non c’è nes¬ 


suna dimostrazione o refutazione a par¬ 
tire dalle assunzioni che i matematici 
hanno fatto effettivamente per cercare 
di deciderla. Considerando la cosa sot¬ 
to un altro aspetto, osserviamo che una 
tecnica standard in matematica è quella 
di dividere una dimostrazione in casi. 
Se la congettura di Goldbach è un 
esempio di w-incompletezza, abbiamo 
un problema che si polverizza in un 
numero infinito di casi! 

Se d’altro canto potessimo dimostra¬ 


re in modo matematico che la conget¬ 
tura di Goldbach è un esempio di 
(^-incompletezza in A, dimostreremo 
(come nel caso di G ) che essa è vera 
per i numeri naturali. Dimostrando in¬ 
fatti che essa esemplifica la w-incomple- 
tezza in A, proveremmo che è impos¬ 
sibile trovare un numero pari maggio¬ 
re di 2 che non sia la somma di due 
primi, il che equivale a provare che 
ogni numero pari maggiore di 2 è la 
somma di due numeri primi. Ciò che 
verrebbe a significare una dimostrazio¬ 
ne siffatta è che qualunque dimostra¬ 
zione informale della congettura di 
Goldbach dovrebbe usare metodi che 
trascendono quelli deU’aritmetica, per 
esempio i metodi del calcolo infinite¬ 
simale. Affermazioni analoghe si po¬ 
trebbero fare per l’ultimo teorema di 
Fermat (si veda Villustrazione a pa¬ 
gina 117). Bisogna sottolineare che 
noi non sappiamo se la congettura di 
Goldbach o l’ultimo teorema di Fermat 
siano esempi di w-incompletezza in A, 
ma ciò non è da escludersi allo stato at¬ 
tuale delle conoscenze. 

Il teorema di Church è pure volto a 
illustrare le difficoltà in cui possiamo 
imbatterci relativamente ai problemi ir¬ 
risolti dell’aritmetica. Il teorema affer¬ 
ma, in termini approssimativi, che non 
c’è nessuna procedura di decisione per 
qualunque sistema formale di aritmeti¬ 
ca. Una analogia può facilitare la com¬ 
prensione. È facile bisecare un angolo 
arbitrario in geometria piana; non è 
necessario conoscere tutto ciò che si 
può fare con riga e compasso. Non si 
deve fare altro che costruire una biset¬ 
trice. Al contrario, per provare che è 
impossibile, in generale, trisecare un 
angolo, è necessaria una definizione 
precisa di tutte le costruzioni possibili 
con riga e compasso. Poiché i greci 
antichi mancavano di tale definizione, 
non erano in condizione di poter dimo¬ 
strare la impossibilità della trisezione. 
Analogamente, procedure di decisione 
si sono applicate per migliaia di anni, 
ma fino al 1930 nessuno ha dato una 
analisi matematica esatta di questa no¬ 
zione. Servendosi appunto di una tale 
analisi rigorosa, Church è riuscito a 
provare che non c’è nessun algoritmo 
per decidere il predicato « L’enunciato 
* esprime una verità dell’aritmetica » 
mentre c’è un algoritmo basato sulla 
divisione per decidere il predicato « x 
è divisibile per y ». 

Church ha dimostrato il suo teorema 
con un ragionamento che ha somiglian¬ 
ze tanto con quello di Godei quanto 
con quello di Cantor, mirante a prova¬ 
re che sono più i numeri reaii che 
non i numeri naturali. La prova di 
Church dimostrava che l’assunzione 
dell’esistenza di una procedura di de- 
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cisione per l’aritmetica porta a una as¬ 
surdità. Ciò significa non solo che non 
abbiamo ancora trovato questo algorit¬ 
mo, ma che non esiste nessun algoritmo 
che permetta sempre di individuare la 
verità aritmetica. In altri termini pro¬ 
prio come non c’è nessun metodo nel 
« filetto » tale da garantire una vincita 
contro tutte le strategie, cosi non c’è 
nessun metodo in aritmetica che garan¬ 
tisca una dimostrazione per tutte le ve¬ 
rità. Ne segue che ci saranno sempre 
verità aritmetiche per cui non saranno 
adeguati i metodi attuali e per cui si 
renderà sempre necessaria la creazione 
di nuovi metodi. 

I teoremi limitativi di Godei e Church 
sembrano avere profonde conseguenze 
filosofiche, ma qualcuno potrebbe obiet¬ 
tare: « Nego che partendo da questi 
teoremi si possano trarre conclusioni fi¬ 
losofiche. Godei e Church hanno pro¬ 
vato che tutti i sistemi formali noti per 
l'aritmetica sono incompleti e manca¬ 
no di una procedura di decisione, ma 
questo è poco più significativo del fat¬ 
to che non si può quadrare il cerchio 
o trisecare un angolo. È perfettamen¬ 
te possibile fare queste costruzioni, ma 
non con riga e compasso solamente. 
Analogamente, tutto ciò a cui perven¬ 
gono i teoremi di Godei e Church è 
che, dati i mezzi che hanno scelto (pro¬ 
prio allo stesso modo in cui Euclide 
scelse riga e compasso), segue inevita¬ 
bilmente la loro conclusione. Non c’è 
nessuna portata filosofica nei loro teo¬ 
remi: bisogna semplicemente cercare al¬ 
tri mezzi ». 

Questa obiezione avrebbe una porta¬ 
ta significativa se non fosse per una so¬ 
la circostanza: che non sembra esserci 
nessun altro mezzo. A questa profonda 
conclusione si è giunti attraverso il ra¬ 
gionamento che segue. Euolide aveva 
studiato triangoli ideali nello sforzo di 
cogliere il concetto di spazio. In modo 
analogo Emil Post negli anni trenta in¬ 
traprese una analisi del modo in cui 
opera un ideale calcolatore umano 
quando appunto esegue calcoli, con il 
proposito di cogliere il concetto di pro¬ 
cedura di decisione. Indipendentemen¬ 
te, e circa nello stesso periodo, A. M. 
Turing intraprese una analisi parallela, 
e guidata dallo stesso obiettivo, di una 
macchina calcolatrice ideale. Si provò 
che le due analisi risultavano equiva¬ 
lenti. Church suggerì che qualunque ef¬ 
fettiva computazione operata da uomi¬ 
ni o macchine poteva essere duplicata 
dall’uomo ideale o dalla macchina idea¬ 
le. La tesi di Church è empirica, ma 
l’evidenza a suo favore è schiacciante. 
Se la accettiamo, gli aspetti limitativi 
dei teoremi di Godei e di Church si 
possono rendere espliciti (si veda l’illu¬ 
strazione a pagina 123). 


Problemi senza risposta 

Il cambiamento fondamentale che i 
teoremi limitativi spingevano ad appor¬ 
tare a tutte le precedenti teorie sulla 
natura della matematica era il ricono¬ 
scimento che ci sono problemi di que¬ 
sta area del sapere destinati a restare 
senza risposta. Precedentemente si era 
convinti del fatto che se un interroga¬ 
tivo si poteva esprimere con esattezza, 
quell’interrogativo doveva avere una ri¬ 
sposta. Ora invece ci si accorgeva che 
forse alcuni quesiti precisi non hanno 
risposte precise. A titolo di analogia si 
pensi a un soggetto, poniamo una lam¬ 
padina. Se voi allora chiedete: « È par¬ 
zialmente fatta di vetro? » la risposta 
sarà probabilmente sì; se voi chiedete 
« È parzialmente di sughero? » la ri¬ 
sposta sarà probabilmente no. Ma se 
chiedete « Pesa esattamente 93 gram¬ 
mi? » la domanda probabilmente è de¬ 
stinata a restare senza risposta. La real¬ 


tà verso cui la domanda è diretta è per 
qualche riguardo indeterminata. Tale 
indeterminatezza è caratteristica dei 
prodotti dell’immaginazione. 

A confronto con le creazioni dell’im- 
maginazione, la realtà fisica è determi¬ 
nata, eppure i risultati della teoria 
quantistica ci dicono che la realtà fisi¬ 
ca è pure in un certo modo indeter¬ 
minata. Proprio come l’indeterminazio¬ 
ne, prima d’allora considerata peculiare 
della immaginazione creativa, è stata 
individuata anche nel mondo fisico con 
la scoperta della teoria quantistica, così 
rindeterminazione è stata ritrovata in 
matematica con la scoperta dei teoremi 
limitativi. La portata rivoluzionaria di 
questa scoperta è paragonabile a quella 
della scoperta pitagorica della incom¬ 
mensurabilità del lato e della diagona¬ 
le del quadrato. Essa capovolge conce¬ 
zioni filosofiche che per un lungo pe¬ 
riodo di tempo sono state fondamentali. 

Il suo peso filosofico si può sottoli- 




La strategia per un gioco di carte in cui lo scopo è di essere i primi a prendere tre 
carte la cui somma dà 15 è identica alla strategia per il « filetto ». I matematici cer¬ 
cano strutture identiche in campi della matematica che sono manifestamente diversi. 
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neare con un altro paragone con la 
geometria euclidea. Limitando le nostre 
assunzioni a quelle di Euclide, non è 
possibile dimostrare resistenza di un 
quadrato la cui area è uguale a quella 
di un dato cerchio; sulla base di queste 
limitazioni concettuali 1’esistenza di ta¬ 
le quadrato è accidentale: non è né ne¬ 
cessaria né impossibile. L’indetermina¬ 
zione è dovuta a un rifiuto di fare as¬ 
sunzioni aggiuntive. L’indeterminazione 
in aritmetica, invece, è dovuta a una 
incapacità sistematica di allargare le 
nostre assunzioni in modo da renderle 
adeguate a dimostrare tutte le verità 
dell’aritmetica. Dal punto di vista di un 
qualsiasi essere umano particolare de¬ 
vono esserci verità accidentali dell’arit¬ 
metica, ossia affermazioni che pur es¬ 
sendo vere -sono tali che niente di ciò 
che egli potrebbe assumere gli permet¬ 
terebbe di dimostrarle vere; esse non 


sarebbero cioè né necessarie né impos¬ 
sibili. Ciò che rappresentano i teoremi 
limitativi, allora, è la scoperta di una 
struttura astratta per la quale non rie¬ 
sce possibile, a nessun essere umano, 
fare sistematicamente assunzioni com¬ 
plete e corrette. Proprio come le no¬ 
stre percezioni sensoriali hanno limiti 
che si possono estendere con certe tec¬ 
niche (per esempio con un microsco¬ 
pio) ma che non si possono eliminare, 
cosi le nostre concezioni astratte sono 
limitate e i metodi della matematica 
miranti a estenderle (per esempio l’in¬ 
duzione matematica) conseguono tutt’al 
più un risultato parziale. I nostri pote¬ 
ri di discriminazione concettuale hanno 
dei limiti proprio come i nostri poteri 
di discriminazione percettiva. 

Non sembra esserci modo di evitare 
queste conclusioni: ci sono anzi conse¬ 
guenze ancora più profonde. Per chia¬ 


rire questo punto bisogna fare una di¬ 
stinzione tra indecidibile e insolubile. 
Un enunciato è indecidibile in un dato 
sistema se né l’enunciato stesso né la 
sua negazione sono dimostrabili nel si¬ 
stema. Il concetto di indecidibilità è re¬ 
lativizzato a un sistema, nel senso che 
ciò che è indecidibile in un sistema può 
essere decidibile in un altro. Per esem¬ 
pio, G è indecidibile in A ma è, come 
abbiamo visto, decidibile (e vero) nel 
sistema più grande che include A e pu¬ 
re l’argomentazione che G è indecidi¬ 
bile in A. Per converso, il concetto di 
insolubilità è assoluto. Un predicato di 
numeri naturali è ricorsivamente solu¬ 
bile se riceve una soluzione da parte 
dell’ideale calcolatore umano (o del¬ 
l’ideale calcolatore meccanico) di cui si 
è detto; in caso contrario è ricorsiva¬ 
mente insolubile. Per esempio il predi¬ 
cato numerico « x è divisibile per y » è 


PARADOSSO 

DEL MENTITORE 

RAGIONAMENTO DI GODEL 

RAGIONAMENTO DI GODEL (PIO DETTAGLIATO) 

Questo enunciato non èvero 

Questo enunciato non è 
dimostrabile. 

Per qualunque numero naturale x, la dimostrazione x non è una dimostrazione 
in A dell’enunciato n. 

Sia L il nome 
dell’enunciato scritto sopra. 

Sia P il nome dell'enunciato 
scritto sopra. 

Sia G il nome dell’enunciato scritto sopra (n è un numero naturale scelto 
in modo che l’enunciato n sia G stesso). 

Si supponga che L sia 
vero. Allora ciò che dice L è 
corretto e L dice di non 
essere vero. Quindi se L 
è vero L non è vero. 

Si supponga che P sia 
dimostrabile. In tal caso, dal 
momento che afferma di non 
essere dimostrabile, P non 
è vero. Dunque se P è 
dimostrabile non è vero. 

Si supponga che G sia dimostrabile nel sistema formale A. Assumendo che 

A è corretto, ciò che G esprime è vero. Tuttavia, dal momento che G non è 
dimostrabile, c’è una inconsistenza. Quindi se A è consistente, G non è 
dimostrabile. Ciò significa che ognuna delle seguenti affermazioni è vera: 

La dimostrazione 1 non è una dimostrazione in A dell'enunciato n. 

La dimostrazione 2 non è una dimostrazione in A dell’enunciato n. 

La dimostrazione 3 non è una dimostrazione in A dell’enunciato n. 



Si può provare che ognuna di queste è anche dimostrabile. Ma « per 
qualunque numero naturale x, la dimostrazione x non è una dimostrazione 
in A dell'enunciato n » non è dimostrabile. Quindi se A è consistente è 
dimostrabile ciascuna esemplificazione numerica di G ma non G stesso. 
Qualunque sistema formale che contiene un enunciato (formale) tale che è 
dimostrabile ciascuna delle esemplificazioni numeriche ma non l’enunciato 
generale è detto io-incompleto. Quindi se A è consistente G non è 
dimostrabile e A è w-incompleto. 

Si supponga che L non 
sia vero. In tal caso ciò 
che L dice è scorretto 
e L deve essere vero. 

Quindi se L non è vero 

L è vero. 

Si supponga che P non sia 
dimostrabile. In tal caso, 
poiché afferma di non essere 
dimostrabile, è vero. Quindi 
se P non è dimostrabile 

P è vero. 

Si supponga che nel sistema formale A sia dimostrabile non-G (non-G = è 
falso che G = negazione di G). In tal caso, poiché sappiamo che ogni 
esempio numerico di G è dimostrabile, abbiamo un sistema in cui esiste un 
enunciato (formale) ogni esemplificazione del quale è dimostrabile ma la 
negazione del quale è pure dimostrabile. Poiché ogni esemplificazione di G è 
vera (purché A sia consistente), la dimostrazione di non-G è una 
dimostrazione di una asserzione falsa. Quindi, se A 0 irrotto, non-G non ò 
dimostrabile. 

Perciò L è vero se e 
solo se L non è vero. 

Perciò P è vero se e solo 
se P non è dimostrabile. 

Perciò G è vero dei numeri naturali se e solo se ogni esempio numerico 
di G è dimostrabile in A ma G non è dimostrabile in A. 

Conclusione: il sistema in 
cui è esprimibile L 
è inconsistente. 

Conclusione: il sistema in 
cui è esprimibile P è o 
scorretto (tale da dimostrare 
enunciati falsi) o incompleto 
(cioè tale da contenere 
verità non dimostrabili nel 
sistema). 

Conclusione: il sistema in cui G è esprimibile (cioè A) è o scorretto (tale da 
dimostrare enunciati falsi) o incompleto (tale da contenere verità non 
dimostrabili nel sistema). 


La dimostrazione data da Godei del suo teorema di incomple¬ 
tezza è qui suggerita dal «paradosso del mentitore». Godei 


considera la dimostrabilità invece della verità e ha provato che 
un sistema formale per l’aritmetica è o scorretto o incompleto. 
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TEOREMA 

LINGUAGGIO DELLA PSICOLOGIA 

LINGUAGGIO DELLA FISICA 

TEOREMA DI 
INCOMPLETEZZA 

DI GODEL 

Non c’è nessun calcolatore umano consistente in grado 
di formulare un programma che, eseguito, 
produrrebbe tutti e solo gli enunciati veri dell’aritmetica. 

Non c’è nessun calcolatore artificiale consistente che 
si possa programmare cosi' da produrre tutti e solo gli 
enunciati veri dell’aritmetica. 

TEOREMA 

DI CHURCH 

Esiste un insieme di problemi dell’aritmetica 
nessun « calcolatore » umano consistente è in 
di risolvere. 

che 

grado 

Esiste un insieme di problemi deiraritmetica che 
nessun calcolatore artificiale consistente può essere 
programmato a risolvere. 


L’aspetto limitativo dei teoremi di Godei e Church diventa evi- que computazione reale, eseguita da un uomo o da una macchi- 

dente alla luce della tesi di Church, secondo la quale qualun- na, può essere duplicata da un uomo o da una macchina ideali. 


ricorsivamente solubile. L’enunciato « * 
esprime una verità dell’aritmetica » in¬ 
vece non è ricorsivamente solubile. Ciò 
non significa che per qualche valore da¬ 
to del predicato il problema non si pos¬ 
sa risolvere. Per esempio, se « 1 + 1=2» 
è l’enunciato 2467 in A , allora l’enun¬ 
ciato « L’enunciato 2467 esprime una 
verità dell’aritmetica » è tanto vero 
quanto dimostrabile. L’insolubilità si¬ 
gnifica che non c’è nessuna tecnica di 
nessun tipo in grado di funzionare sem¬ 
pre in modo corretto allo stesso modo 
in cui funziona sempre la divisione. Sor¬ 
ge naturalmente il problema consisten¬ 
te del chiedersi se qualche noto proble¬ 
ma della matematica elementare è, o 
no, ricorsivamente insolubile. Non c’è 
nessun motivo apparente perché la ri¬ 
sposta possa essere negativa. Per esem¬ 
pio, il predicato « x è divisore di un 
numero perfetto » potrebbe benissimo 
essere ricorsivamente insolubile e per¬ 
ciò, sulla base della tesi di Church, 
insolubile nel senso ordinario, cioè a 
dire insolubile da parte di qualunque 
uomo o calcolatore. 

Problemi pratici 

Come se non bastasse, ci sono an¬ 
cora altre possibili difficoltà. Ho de¬ 
scritto finora ciò che si potrebbe chia¬ 
mare l’indecidibilità teorica e l’insolubi¬ 
lità teorica. Bisogna aggiungere che esi¬ 
stono anche fenomeni di indecidibilità 
pratica e di insolubilità pratica. Un e- 
nunciato formale è praticamente indeci¬ 
dibile se, pur essendo teoricamente deci¬ 
dibile, la dimostrazione è talmente lun¬ 
ga da non potersi eseguire per pura im¬ 
possibilità fisica. Per esempio, può dar¬ 
si che la congettura di Goldbach sia 
vera, ma che le dimostrazioni più bre¬ 
vi entro un dato sistema richiedano più 
litri di inchiostro di quanti non siano 
gli atomi dell’universo. Oppure, se la 
congettura è falsa, può darsi che il pri¬ 
mo numero pari che non è la somma 
di due numeri primi sia grande al pun¬ 
to che la possibilità di scoprirlo risulta 


virtualmente nulla. Oppure, di nuovo, 
un predicato è praticamente insolubile 
se, pur essendo teoricamente solubile, 
è fisicamente impossibile utilizzare le 
tecniche di soluzione. Per esempio, le 
tecniche per la soluzione del predicato 
« x è divisore di un numero perfetto » 
possono essere cosi complicate da supe¬ 
rare la capacità di qualsiasi essere uma¬ 
no o calcolatore concepibile. La capa¬ 
cità di uomini e calcolatori di affronta¬ 
re certe complicazioni ha un limite, 
mentre l’aritmetica presenta problemi 
le cui soluzioni sono molto complicate. 

Si potrebbe chiedere: « Ammettiamo 
che non si possa dimostrare la comple¬ 
tezza dei sistemi formali deiraritmetica 
e che non ci sia nessuna procedura di 
decisione. Ammettiamo inoltre che ci 
possano essere seri problemi di indeei- 
dibilità pratica e di insolubilità pratica 
per l’aritmetica. Possiamo almeno di¬ 
mostrare che questi sistemi dell’aritme¬ 
tica sono consistenti? ». Al giorno d’og¬ 
gi la risposta è a metà strada tra si e 
no. Ci sono dimostrazioni di consisten¬ 
za basate su metodi talmente complica¬ 
ti da essere più dubbi che non la con¬ 
sistenza stessa dei sistemi. D’altro can¬ 
to, se ci limitiamo a metodi non più 
complicati dall’aritmetica stessa, allora 
incontestabilmente possiamo dimostra¬ 
re un enunciato formale esprimente la 
consistenza. Tuttavia per essere sicuri 
che l’enunciato formale esprima la con¬ 
sistenza, dobbiamo assumere la consi¬ 
stenza dell’aritmetica! Come Godei ha 
sottolineato, la questione della consi¬ 
stenza riposa sulla nostra capacità di 
« sostituire [gli assiomi della matema¬ 
tica classica] relativi a entità astratte di 
una oggettiva sfera platonica con intui¬ 
zioni di date operazioni della mente ». 

La verità aritmetica cosi ha una na¬ 
tura « ideale » o « prospettiva » (i ter¬ 
mini sono stati proposti da John My- 
hill). L’analogia con un gioco può es¬ 
sere utile per illustrare questa nozione. 
Accade spesso che si inventi un gioco 
e che si pongano regole che lo defini¬ 
scono, ma che più tardi sorga una cir¬ 


costanza per la quale le regole non dan¬ 
no nessuna istruzione. A questo punto 
deve essere presa una decisione su ciò 
che dovrà essere la regola relativa a 
questa circostanza. Una decisione si po¬ 
trebbe prendere con un criterio di ele¬ 
ganza, o con uno che assicuri un più 
intenso divertimento dello spettatore, o 
che incrementi il rischio, o sortisca 
qualche altro effetto. La decisione non 
si prenderà comunque sulla base delle 
regole del gioco proprio in quanto que¬ 
ste sono definite in modo incompleto. 
Ora parte della forza dei teoremi limi¬ 
tativi sta nel fatto che le regole per 
mezzo delle quali definiamo e scopria¬ 
mo la verità aritmetica non soltanto so¬ 
no, ma devono essere definite in modo 
incompleto. Siamo perciò costretti a de¬ 
finire storicamente la nozione di ve¬ 
rità aritmetica; essa non può essere 
esplicitata una volta per tutte ma deve 
essere ridefinita continuamente. Abbia¬ 
mo visto come tanto Gauss quanto Lo- 
bacevskdj siano giunti alla conclusione 
che i problemi della verità nella geo¬ 
metria non-euclidea li spingevano a pro¬ 
cedere oltre i dati della pura geome¬ 
tria. In modo analogo dobbiamo oltre¬ 
passare i dati dell’aritmetica se voglia¬ 
mo definire la verità aritmetica. L’uo¬ 
mo ha creato un gioco deiraritmetica 
che è incompleto, a quanto pare a cau¬ 
sa della incommensurabilità tra i suoi 
ideali e le sue possibilità. 

È certo una tentazione molto forte 
quella di dire che se l’aritmetica può 
essere un gioco, è un gioco nel quale 
impariamo qualcosa intorno alla real¬ 
tà - la realtà astratta. In tal caso signi¬ 
fica che c’è una incommensurabilità tra 
la realtà astratta e la nostra capacità di 
intenderla pienamente. Se il predicato 
« L’enunciato x esprime una verità del¬ 
l’aritmetica » fosse solubile, l’aritmeti¬ 
ca diventerebbe poco interessante dal 
punto di vista teorico. Non essendo so¬ 
lubile, l’aritmetica continuerà a susci¬ 
tare il nostro interesse proprio per il 
fatto che la sua indagine esige il con¬ 
tributo della creatività umana. 
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La macchina di Turing e la questione da essa sollevata: 
può una macchina pensare? 


di Martin Gardner 


« Ci fu un tempo in cui dev’essere sembrato molto improbabile che le mac¬ 
chine potessero imparare a esprimere i loro desideri con parole che giungessero 
all’orecchio umano; non potremmo perciò immaginare che verrà un giorno in 
cui l’orecchio umano non sarà più necessario, perché i desideri della macchina 
saranno percepiti dai delicati meccanismi della macchina stessa, quando il loro 
linguaggio si sarà sviluppato dal pianto degli animali a una parola altrettanto 
complicata quanto la nostra? » 


— samuel butler, Erewhon. 



lan Mathison Turing, un matematico inglese morto nel 1954 all’età di 42 an¬ 


ni, fu uno dei più creativi fra i primi studiosi di calcolatori. Oggi è ben no- 


JL A.to soprattutto per il suo concetto di «macchina di Turing». Descriveremo 
brevemente questo tipo di macchina, per poi passare a una delle sue idee meno 
conosciute, il «gioco di Turing», che conduce a profonde controversie filosofiche. 

La macchina di Turing è una « scatola nera » (un congegno cioè dai mec¬ 
canismi non specificati) capace di osservare un nastro di lunghezza infinita diviso 
in celle quadrate. La scatola può avere qualsiasi numero finito di stati. Una 
parte finita del nastro consiste di celle non vuote, su ognuna delle quali è 
impresso uno qualsiasi di un numero finito di simboli. Quando la scatola 
esamina una particolare cella, essa può lasciare il simbolo inalterato, cancellarlo, 
sostituendolo con un altro simbolo, o stampare un simbolo in una cella vuota. 
Il nastro può poi venir spostato di una cella verso destra o verso sinistra, oppure 
rimanere fermo. La « scatola nera » a sua volta può rimanere nello stesso stato, 
o passare a un altro. 

Una tabella di regole stabilisce il comportamento della macchina per ogni 
possibile combinazione di stati e simboli; una tabella di questo tipo definisce com¬ 
pletamente una particolare macchina di Turing. Esiste una infinità numerabile 
(alef con zero) di macchine di Turing, ognuna progettata per un compito spe¬ 
cifico; per ogni compito diverso la struttura della macchina può variare molto 
in simboli, stati e regole. 

Un buon sistema per capire in che consiste una macchina di Turing, è quello 
di costruirne una, sia pure del tipo più rudimentale. Otto celle sul nastro di 
carta sono contrassegnate con 1111 + 111 per indicare la somma di 4 e 3 in 
un sistema « a base uno », sistema in cui un numero intero n è rappresentato 
da n « uno ». Per costruire la macchina disegnamo un quadrato (la scatola ne¬ 
ra) e tagliamo su di esso due fessure in modo da potervi inserire il nastro 
come indicato nella figura. Sistemiamo il nastro in modo che sia visibile il primo 
1. La tavola sotto l’illustrazione della pagina a fronte dà le regole necessarie. 

Cominciamo supponendo che la macchina si trovi nello stato A; consultia¬ 
mo la tabella circa la combinazione del simbolo 1 con lo stato A e facciamo 
quanto indicato: cancelliamo cioè l’I, spostiamo il nastro verso sinistra (così che 
la scatola osservi la successiva cella sulla destra) e supponiamo che ora la mac¬ 
china passi nello stato B. Si continua in questo modo finché la tavola non ci 
dica di fermarci. 

Se si seguono le regole correttamente, la macchina cancellerà il primo 1, 
sposterà il nastro verso sinistra, cella per cella, fino a inquadrare il segno +, 
cambierà il + in 1 e si fermerà. Il nastro porterà a questo punto 1111111 ossia 
7. Queste semplici regole programmano ovviamente la macchina per l’addizione 
di qualsiasi coppia di numeri interi anche molto grandi. 

Si tratta naturalmente di un sistema lento e noioso, ma l’intenzione di Tu¬ 
ring era di ridurre il calcolo meccanico a uno schema semplice e astratto, ren¬ 
dendo così più semplice l’analisi di spinose questioni teoriche quali lo stabilire 
cosa può e cosa non può venir calcolato. Turing ha dimostrato che questo 
suo congegno idealizzato può essere programmato per realizzare nel suo rozzo 
modo qualsiasi operazione alla portata del più potente calcolatore elettronico. 
Naturalmente come ogni calcolatore, e anche come il cervello umano, la mac¬ 
china di Turing è limitata dal fatto che per certi calcoli occorre un numero 
infinito di passi (per esempio per calcolare ir) e dal fatto che certi problemi sono 


126 




insolubili in linea di principio: non esiste, cioè, alcun algoritmo o procedimento 
efficace per risolverli. Una « macchina universale di Turing » è in grado di 
effettuare qualsiasi operazione che ogni singola macchina di Turing specializzata 
può effettuare; in altre parole, essa è in grado effettivamente di calcolare tutto 
ciò che è calcolabile. 

Nel 1950 apparve sul numero di ottobre di « Mind », una rivista inglese 
di filosofìa, l’articolo di Turing intitolato Computing machinery and intelligence 
riprodotto in seguito in molte antologie, e anche nel volume La filosofia degli 
automi (Boringhieri, 1965). «Propongo — incominciava Turing — di prendere 
in considerazione la questione: può una macchina pensare? » Turing, conside¬ 
rando una simile domanda troppo vaga per avere una risposta significativa, sug¬ 
geriva di sostituirla con una più precisa: si può insegnare a un calcolatore 
a vincere il « gioco di imitazione »? (ora generalmente noto come « gioco di 
Turing »). 

Questo test è basato su un gioco di società in cui un uomo si nasconde in 
una camera e una donna in un’altra camera. Un « interrogatore », uomo o don¬ 
na, pone domande, per mezzo di intermediari, alle due persone nascoste, e ne 
riceve risposte dattiloscritte. Ognuno dei giocatori cerca di convincere l’inter¬ 
rogatore di essere, diciamo, la donna. L’interrogatore vince se, in base alle ri¬ 
sposte, riesce a stabilire la verità. 

Supponiamo, dice Turing, di sostituire uno dei giocatori nascosti con una 
macchina che apprende, alla quale sia stato insegnato a esprimersi in un lin¬ 
guaggio ordinario, per esempio l’inglese. E’ possibile per una simile macchina 
riuscire a ingannare l’interrogatore, quando sia la macchina sia l’altra persona 
nascosta cerchino di convincere l’interrogatore di essere umani? 

Qui il senso di « ingannare » andrebbe definito esattamente; qual è la lun¬ 
ghezza della conversazione ammessa, qual è l’intelligenza dell’interrogatore e 
quella della persona in gara con la macchina? Attualmente un calcolatore riesce 
a superare il « test di Turing » se l’interrogatore è un bambino e se gli sono 
permesse solo poche domande. Probabilmente non ci saranno drammatici colpi 
di scena in futuro, così come probabilmente non ce ne furono nella lenta evolu¬ 
zione dell’uomo. Le macchine parlanti potrebbero migliorare gradualmente, di 
modo che saranno necessari dialoghi sempre più lunghi e interrogatori sempre 
più intelligenti per battere la macchina. Forse un giorno solo un calcolatore 
sarà in grado di battere regolarmente un altro calcolatore. Turing stesso ha fatto 
una prudente previsione: nel 2000, ha scritto, i calcolatori parleranno inglese in 
modo abbastanza disinvolto da ingannare un « interrogatore medio » per circa il 
30% delle volte, dopo circa 5 minuti di dialogo. Egli immaginò la seguente 
tipica conversazione tra una persona e un calcolatore: 

Domanda: Scrivimi un sonetto su Forth Bridge. 

Risposta: Lascia perdere, non sono mai stato capace di comporre poesie. 

D. Addiziona 34957 e 70764. 

R. (pausa di circa 30 secondi) 105621. 

D. Sai giocare a scacchi? 

R. Sì. 




STATO A. 

STATO B. 

1 

1. CANCELLA L'1. 

2. LEGGI LA CELLA SUCCESSIVA A DESTRA. 

3. PASSA ALLO STATO B. 

1. LEGGI LA CELLA SUCCESSIVA A DESTRA. 

2. RIMANI NELLO STATO B. 

+ 


1. CANCELLA IL +. 

2. STAMPA 1. 

3. STOP. 


Una macchina di Turing per l’addizione. 













































D. Bene: ho il re el e nessun altro pezzo.- Tu hai solo il re in e3 e la 
torre in h8. Tocca a te muovere. Cosa fai? 

R. (pausa di 15 secondi) h8-hl. Matto. 

Esistono parecchi programmi che consentono a un calcolatore di simulare 
una conversazione in inglese. Joseph Weizenbaum, un ingegnere del MIT, ne ha 
preparato uno che ha battezzato « Elisa » (nome ispirato dall’Eliza Doolittle del 
Pigmalione di Shaw). Il « New York Times », il 5 giugno 1968, ha riprodotto un 
dialogo tra una donna e un calcolatore, un IBM 7094, in veste di psicanalista: 

Donna: Gli uomini sono tutti uguali. 

Calcolatore: Perché? 

D. Ci seccano sempre per un motivo o per l’altro. 

C. Può darmi un esempio specifico? 

D. Beh, il mio amico ha insistito perché venissi da lei. 

C. Il suo amico ha insistito? 

D. Sì, dice che sono depressa. 

C. Mi spiace sentire che lei è depressa. 

D. E’ vero, sono infelice. 

C. Crede che venendo da me troverà un aiuto? 

D. Ho bisogno di aiuto, certo. 

C. Che specie di aiuto cerca? 

D. Forse, dovrei imparare ad andare d’accordo con mia madre. 

C. Mi dica qualcosa di più sulla sua famiglia. 

D. Mia madre si occupa di me. 

C. Chi altro si occupa di lei in famiglia? 

D. Mio padre. 

C. Suo padre? 

D. Lei è un po’ come mio padre, in un certo senso. 

C. Che somiglianze trova? 

D. Lei non è molto aggressivo, ma credo che non voglia farmelo notare. 

C. Cosa le fa pensare che io non sia molto aggressivo? 

D. Beh, non mi contraddice. 

Il dialogo continua nello stesso modo ed è indistinguibile da una conversa¬ 
zione tra un paziente e uno psicanalista. Il programma non era nemmeno un 
programma di apprendimento. Weizenbaum ammise volentieri che il calcolatore 
non « capiva » niente di quanto veniva detto. Un simile calcolatore non potrebbe 
certamente superare il test di Turing. Supponiamo però che nell’anno 2000 i cal¬ 
colatori possano giocare al « gioco di Turing » altrettanto bene quanto oggi gio¬ 
cano a dama e a scacchi: che significato avrebbe questo, dal punto di vista 
« mente » del calcolatore? 

Chi ha visto il film 2001: Odissea nello spazio, ricorderà probabilmente che 
il calcolatore della nave spaziale, hal, è definito come capace di « pensare » in 
quanto «avrebbe potuto superare con facilità il test di Turing». hal «pensa» 
veramente o imita semplicemente il pensiero? Turing era convinto che, quando 
un giorno i calcolatori sapranno discutere abbastanza bene da superare il suo 
test, nessuno potrà mettere in dubbio che essi « pensino ». 

A questo punto sorgono interrogativi complicatissimi. Può un simile calco¬ 
latore essere cosciente di se stesso? Può avere emozioni? Senso dell’humor? In 
breve, può essere considerato una « persona » o è solo una macchina inerte co¬ 
struita per imitare una persona? 

Keith Gunderson, criticando l’articolo di Turing in « Mind » (aprile 1964) 
scriveva che la capacità di un calcolatore di passare il test di Turing non pro¬ 
verebbe niente dal punto di vista filosofico. E’ possibile (l’esempio è mio) costrui¬ 
re un tulipano di cera che non sia distinguibile a vista da un tulipano vero, 
questo certamente non prova nulla circa la capacità di un chimico di sintetizzare 
le sostanze organiche del tulipano. Un calcolatore parlante potrebbe provare 
qualcosa, oltre al fatto che un calcolatore può essere in grado di imitare la con¬ 
versazione? Gunderson concludeva: « il fatto che l’operaio sia stato rimpiazzato 
dalla scavatrice nelle gallerie, non prova certo che la macchina abbia dei mu¬ 
scoli; prova, casomai, che i muscoli non sono necessari per scavare gallerie ». 

Una interpretazione curiosa del test di Turing è quella data da Michael 
Scriven in una conferenza del 1959, pubblicata poi col titolo The Compleat 
Robot: A Prolegomena to Androidology nella raccolta Dimensions of Mind. 
Scriven ammette che la capacità di parlare non prova che il calcolatore possegga 
altri attributi di una « persona ». Supponiamo però che un calcolatore parlante 
apprenda il significato di « verità » (nel senso, per esempio, specificato da Alfred 
Tarski nell’articolo in questo volume) e che sia programmato in modo tale da 
non poter mentire. « Questo lo renderebbe certamente inadatto — dice Scriven 
— al ruolo di cameriere personale, copywriter pubblicitario o personaggio po¬ 
litico, ma potrebbe renderlo capace di un altro servizio. » Ma potremo chiedergli 
se è cosciente di esistere, se ha emozioni, se crede che certe barzellette siano 
divertenti, se agisce liberamente, se gli piace un dato autore ecc., e avremmo 
il diritto di considerare le risposte come corrette. 

E’ possibile che la « macchina di Scriven » (come l’hanno battezzata alcuni 
filosofi polemizzando con l’articolo di Scriven) risponda no a tutte queste do¬ 
mande. Ma se dà una risposta, Scriven sostiene, saremmo giustificati nel 


dargli credito come a un essere umano, e non avremmo ragioni per negargli la 
definizione di « persona ». 

I filosofi non sono d’accordo su quanto sostenuto da Turing e da Scriven. 
In un articolo intitolato The supercomputer as Liar {« Mind », febbraio 1963) 
Scriven rispose ad alcuni critici. Mortimer J. Adler in The Difference of Man 
and thè Difference It Makes è del parere che il test di Turing sia una questione 
di « tutto o niente » e che il successo o l’insucesso nel creare calcolatori capaci 
di superare questo test, rafforzerà o rispettivamente indebolirà la teoria che 
l’uomo sia diverso da ogni macchina possibile, come da ogni animale. 

Ma le macchine parlanti riuscirebbero veramente a smuovere la fede di coloro 
che credono in questa netta distinzione? Non è difficile immaginare che tra 50 
anni ci potrà essere un programma televisivo con un robot come animatore 
nella cui memoria saranno immagazzinate migliaia di barzellette; dubito che 
qualcuno ne potrà dedurre che il robot abbia un senso dell’humor, come nes¬ 
suno, battuto agli scacchi da un calcolatore, dedurrebbe di aver a che fare 
con un calcolatore di genere diverso da quello che gioca a filetto. Le regole della 
sintassi e della semantica non sono in effetti diverse dalle regole degli scacchi. 

In ogni modo il dibattito continua, complicato da credenze metafisiche 
e religiose e da complessi problemi linguistici. Tutti i vecohi dilemmi concer¬ 
nenti il corpo, la mente e la natura della personalità sono riproposti in una nuova 
terminologia. 

Samuel Buffer, in Erewhon spiega come gli abitanti di Erewhon distrussero 
le loro macchine prima che queste potessero trasformarsi da servitori in padroni: 
le sue parole erano lette cento anni fa solo come improbabile satira; oggi, 
suonano come una profezia. « Non dà sicurezza — scriveva Buffer — contro 
l’estremo sviluppo della coscienza meccanica, il fatto che oggi le macchine 
posseggono un basso grado di coscienza. Un mollusco non ha molta coscienza 
di se stesso. Riflettete sugli enormi progressi fatti dalle macchine durante gli 
ultimi cento anni, e notate quanto invece progredivano lentamente il regno 
animale e vegetale. Le macchine più organizzate non sono tanto creature di 
ieri, quanto degli ultimi minuti, per così dire, in confronto al lento evolversi 
della natura ». 
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Giochi, logica e calcolatori 

Un solitario con domino colorati mostra che sono strettamente legati. 
Il fatto che si possa vincere il gioco oppure no è analogo al fatto 
che un problema si possa o meno risolvere per mezzo di un calcolatore 

di Hao Wang 


O ggi molto del lavoro che una volta 
era fatto dall’uomo viene delega¬ 
to alle macchine e la gente si chie¬ 
de sempre più spesso: quali sono le capa¬ 
cità umane insostituibili? Che cosa non 
possono fare le macchine? Può sorpren¬ 
dere il lettore che, mentre la prima do¬ 
manda non ha una risposta definita, la 
seconda ha una soluzione matematica 
immediata. 

Prima della costruzione del primo dei 
moderni calcolatori, il logico inglese A- 
lan Turing formulò il seguente proble¬ 
ma: che cosa non possono fare i calcola¬ 
tori? Nel suo tentativo di creare una 
teoria su ciò che può essere computato e 
ciò che non può esserlo, Turing progettò 
un semplice calcolatore immaginario che 
dimostrò capace, da un punto di vista 
teorico, di effettuare tutte le operazioni 
di un qualsiasi calcolatore. Egli usò la 
sua macchina per dimostrare la stretta 
parentela fra la scienza dei calcolatori e 
la logica, branche della matematica che 
riguardano entrambe il concetto di di¬ 
mostrazione matematica e i sistemi di 
notazione che permettono di presentare i 
nostri ragionamenti in forma esatta. Que¬ 
sto articolo si propone di illustrare alcu¬ 
ni concetti fondamentali nel terreno co¬ 
mune alla scienza dei calcolatori e alla 
logica per mezzo dei giochi. 

La mente umana può afferrare sola¬ 
mente numeri e quantità relativamente 
piccole. La matematica, al contrario, è 
interessata in modo essenziale all’infini¬ 
to. Le operazioni matematiche finite, da 
un lato, e le entità matematiche infinite, 
dall’altro, presentano un contrasto signi¬ 
ficativo e affascinante. La trasposizione 
graduale dei casi individuali, intuitiva¬ 
mente comprensibili, alle situazioni ge¬ 
nerali è un’importante acquisizione del¬ 
l’intelletto umano. Alcune considerazio¬ 
ni astratte concernenti i giochi condur¬ 
ranno ih maniera naturale ail’osservazio- 
ne di questo fenomeno. 

Trovare la successione di mosse che 
più probabilmente conduce alla vittoria 
in un gioco come il ticktacktoe è un pro¬ 


blema logico analogo a quello di trovare 
la serie dei passi che conducono alla so¬ 
luzione di qualsiasi problema matemati¬ 
co di una data classe. Per certi giochi 
non esiste una strategia ottimale che ga¬ 
rantisca la vittoria; per certe classi di 
problemi non esiste un algoritmo, ossia 
non esiste nessun metodo generale che 
fornisca una serie di passi che conduca¬ 
no a una soluzione. Poiché il program¬ 
ma di un calcolatore è semplicemente un 
algoritmo progettato per operare per 
mezzo della macchina, ciò significa che 
esistono classi di problemi che i calcola¬ 
tori non possono risolvere. Prima di con¬ 
siderare le difficoltà concernenti la co¬ 
struzione di algoritmi per risolvere pro¬ 
blemi (ovvero la formulazione dei pro¬ 
grammi per ottenere soluzioni o la for¬ 
mulazione di strategie ottimali), vedremo 
perché la loro costruzione non è solo 
utile ma rappresenta anche uno degli 
scopi fondamentali della matematica. 

/^Avviamente sarebbero necessari tempo 
ed energia infiniti per memorizzare 
la tavola per la moltiplicazione se, invece 
di includere solo i prodotti di tutte le 
coppie di numeri in una sola cifra, la ta¬ 
vola includesse il prodotto di tutte le 
coppie di numeri. L’uomo ha reso inutile 
questa tavola di moltiplicazione infinita 


limitandosi a memorizzare, oltre alla ta¬ 
vola di moltiplicazione per i numeri di 
una cifra, una lista di passi che include il 
riporto e l’addizione dei prodotti parzia¬ 
li: ciò permette di ottenere il prodotto di 
due numeri qualsiasi di più cifre. 

Sappiamo che le operazioni dell’arit¬ 
metica elementare comportano regole 
formali, e molti di noi ricordano che 
certe altre operazioni, come l’estrazione 
di radice quadrata, possono essere fatte 
secondo una lista fissa di passi successi¬ 
vi. Se abbiamo a che fare con problemi 
di maggior complessità diviene meno 
chiaro che essi possono essere risolti per 
mezzo di un algoritmo. Si consideri il se¬ 
guente problema: dati due numeri positi¬ 
vi 6 e 9, si trovi il loro massimo comun 
divisore. II lettore risponderà immedia¬ 
tamente: 3. Se i due numeri fossero 68 e 
153, lettori che fossero propensi a tenta¬ 
re le varie possibilità potrebbero ancora 
trovare la risposta (17). Comunque, se si 
potesse mostrare che il problema genera¬ 
le «Dati due numeri positivi a e b, si tro¬ 
vi il loro massimo comun divisore» può 
essere risolto con un algoritmo, allora 
chiunque, o qualunque macchina capace 
di effettuare le operazioni specificate, 
potrebbe risolverlo per qualsiasi a e b. 
Un algoritmo di questo tipo effettivamen¬ 
te esiste e risale a Euclide (si vedano 



Il problema del domino riguarda la riunione di tessere colorate appartenenti a tre tipi diversi per 
formare una superficie, estendibile all'infinito, in modo che tutti i bordi adiacenti abbiano lo 
stesso colore (si veda la pagina a fronte). Si suppone che il giocatore abbia una quantità infinita 
di domino di ogni tipo e che non si possa ruotare nessun domino nel piano. II problema si 
risolve trovando una superficie rettangolare in cui la successione dei colori del bordo superiore è 
la stessa di quello inferiore, e la successione del bordo destro è la medesima di quello sinistro. I- 
terando tale superficie in ogni direzione si può ricoprire un piano infinito (fi veda la pagina a fronte). 
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GCD sR THIS ROUTINE C0MPUTES THE GREATEST C0HM0N 
:R DIVIS0R 0F TW0 INTEGERS A AND 8. 

: R 

EXTERNAL FUNCTI0N (A,B) 

N0RHAL M0DE IS INTEGER 
ENTRY T0 GCD. 

L00P R£MA I N = 3 - A*(B/A) 

WHENEVER REMAI N.E.O,FUNCTI0N RETURN .ABS.CA) 

3 = A 

A = REMA IN 


TRANSFER T0 L30P 
END 0F FUNCTI0N 


TYPE INPUT 
A=8,8=12* 

THE GCD OF A AND B IS 
A 


TYPE INPUT 

A =12345678,3=87654321* 
THE GCD 0F A AND B IS 
9 


1 Si considerino due interi positivi 
a e b. Si passi all’istruzione 
successiva. 

2 Si confrontino i due numeri in 
esame (si determini se sono 
uguali, in caso contrario si 
determini quale dei due è 

il maggiore). Si passi 
all’istruzione successiva. 

3 Se i numeri sono uguali ognuno 
di essi è la risposta; stop. 

Se non sono uguali, si passi 
all’istruzione successiva. 

4 Si sottragga il numero più 
piccolo dal più grande e si 
sostituiscano i due numeri in 
esame col sottraendo 

e col resto. Si passi 
all’istruzione 2. 


Un algoritmo nel linguaggio ui calcolo stabilisce una serie di passi tramite i quali si può trovare il 
massimo comun divisore di due numeri dati qualsiasi. In basso sono computate le soluzioni per due 
coppie di numeri. La procedura è data nel linguaggio MAD (da Michigan Algorithm Decoder). 
Sopra la lettera O, allo scopo di distinguerla dallo zero, è stata stampata una linea trasversale. 


Lo stesso algoritmo viene ora espresso nel lin¬ 
guaggio ordinario. Il processo della divisione è 
reso attraverso sottrazione ripetuta. La serie dei 
passi è conosciuta come algoritmo euclideo. 



AAAA*BBBBI I 


11*11 


I I ! 


In questa illustrazione schematica una macchina di Turing ideata per 
effettuare i passi dell’algoritmo euclideo porta i numeri 4 e 6 sul suo 
nastro. (Ciascuna cifra è rappresentata da una sbarra; un asterisco 
segnala la separazione dei numeri.) Il controllo logico della macchina 
consiste di istruzioni determinate dal segno stampato sulla cella in 
esame e dalla posizione del quadrante di memoria. I passi dell’algo¬ 
ritmo euclideo conducono ai cambiamenti del nastro illustrati in se¬ 
quenza in basso nella figura. Prima la macchina determina quale 
numero è maggiore mediante un «ciclo di confronto» in cui si sostitui¬ 
scono le sbarre a destra e a sinistra dell’asterisco con dei simboli («A» 


a sinistra e «B» a destra). Quando un insieme di sbarre è esaurito, la 
macchina inizia il «ciclo di sottrazione», cancellando i simboli del 
numero più piccolo e riconvertendo i simboli del numero più grande 
in sbarre. Queste sono separate per mezzo di un asterisco dalle due 
sbarre che rappresentano il resto della sottrazione. II processo di 
confronto e di sottrazione viene ripetuto per 4 e 2, poi per 2 e 2 e 
infine 2 e 0 appaiono sul nastro. A questo punto, appena inizia il ciclo 
di confronto, il nastro bianco a lato dell’asterisco fa scattare il segnale 
d’arresto (!): la macchina si ferma e sul nastro compare la risposta 
(2). È una macchina ideale perché il nastro è potenzialmente infinito. 
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le illustrazioni in alto a pagina 132). 

L’utilità degli algoritmi è ugualmente 
evidente nel campo dei giochi, dove essi 
sono studiati allo scopo di compiere le 
mosse più vantaggiose. Il matematico, 
naturalmente, è meno interessato a vin¬ 
cere un gioco che a capire la struttura 
astratta della classe di giochi a cui ap¬ 
partiene. Considerando resistenza o la 
non esistenza di una strategia che condu¬ 
ce alla vittoria, egli aumenta la sua com¬ 
prensione della struttura astratta di quel 
gioco e di quelli del medesimo tipo. 

Si prenda per esempio il gioco cono¬ 
sciuto come nim. Un numero qualsiasi di 
oggetti, diciamo sei fiammiferi, sono 
messi in tre pile. Due giocatori, A e B, 
muovono a turno, prendendo ciascuno 
un numero qualsiasi di fiammiferi da 
una pila qualsiasi. Chi prende l’ultimo 
fiammifero è il vincitore. Poiché la quan¬ 
tità finita di fiammiferi prima o poi si 
esaurirà, è ovvio che il gioco non per¬ 
mette pareggio. È significativo che sola¬ 
mente uno dei giocatori abbia una stra¬ 
tegia vincente, che dipende dalla gran¬ 
dezza delle tre pile di fiammiferi iniziali 
e da chi muove per primo. Nel gioco 
particolare definito per pile di 1, 2 e 3 
fiammiferi, esiste una strategia vincente 
per B, il giocatore che muove per secon¬ 
do. Questa situazione può essere rappre¬ 
sentata per mezzo di un albero schema¬ 
tico dove i nodi rappresentano la situa¬ 
zione ai vari stadi del gioco e i rami che 
partono da ciascun nodo rappresentano 
le possibili mosse che il giocatore può 
fare in quella situazione (si veda l’illu¬ 
strazione in alto a destra). 

Si supponga di giocare con tre pile 
contenenti rispettivamente dieci milioni, 
234 e 2729 fiammiferi. È teoricamente 
possibile calcolare tutte le sequenze pos¬ 
sibili di mosse a partire da queste tre pile 
e poi dire se esiste una strategia vincente 
per A o per B. Comunque nessuno vor¬ 
rebbe o sarebbe in grado di effettuare 
tale calcolo. Il matematico inizierebbe 
una sistematica ricerca di scorciatoie per 
rendere le operazioni più facili e per 
realizzare una economia di pensiero. Una 
ricerca di questo tipo in effetti è stata 
fatta per il gioco del nim ed è stato otte¬ 
nuto un semplice metodo per determina¬ 
re quale giocatore abbia la strategia vin¬ 
cente. 11 metodo stabilisce che A può 
vincere sempre se, una volta espresso il 
numero degli oggetti nelle tre file in no¬ 
tazione binaria, sommando colonna per 
colonna le cifre di questi tre numeri bi¬ 
nari, non si ottiene mai come totale di 
una colonna un numero dispari. L’algo¬ 
ritmo scoperto può rappresentare una 
trovata geniale ma non importante, op¬ 
pure il conseguimento di una maggior 
conoscenza matematica, a seconda della 
natura del gioco e delle sue relazioni con 
problemi matematici e logici più impor¬ 
tanti. 

Un gioco come il nim si dice «ingiu¬ 
sto», perché un giocatore ha sempre una 
strategia vincente. Un gioco come il tick- 
tacktoe si dice «vano» perchè ciascun 
giocatore ha una strategia per non per¬ 
dere che impedisce che ci sia un vincito- 



L’albero per il nim indica che il giocatore che muove per secondo, B, ha una strategia vin¬ 
cente. All’inizio del gioco (in basso) ci sono pile di uno, due e tre fiammiferi (le cifre di 
ciascun nodo dell'albero danno il numero dei fiammiferi che rimangono nelle pile). I giocatori 
tolgono uno o più fiammiferi da una singola pila finché uno dei due giocatori vince togliendo 
l'iillimo fiammifero. I rami mostrano tutte le possibili mosse di A e le risposte di B a ognuna. 



Il lemma dell’infinito si può rappresentare con un albero illimitato verso l’alto. Il lemma 
stabilisce che se nell’albero esistono infiniti rami connessi, e se da ciascun nodo parte solo un 
numero finito di ramificazioni, allora deve esistere un nodo, a ciascun livello, da cui le 
ramificazioni si estendono indefinitamente verso l’alto; questi nodi formano un sentiero infinito 
che attraversa l’albero. Il lemma dell’infinito può parafrasarsi così: se la specie umana non 
scomparirà mai, allora oggi esiste qualcuno che in ogni istante del futuro avrà un discendente. 
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re. Queste caratterizzazioni possono es¬ 
sere espresse come teorema: ogni gioco è 
vano o ingiusto se esiste un limite supe¬ 
riore finito alla lunghezza di ciascun sen¬ 
tiero del suo albero e se esiste un numero 
finito di rami che partono da ciascun 
nodo. Il teorema vale perchè, se non 
sono ammessi giochi senza fine, e se a 
ogni stadio esiste solo un numero finito 
di mosse, allora il numero totale delle 
possibili sequenze di mosse è finito. Se si 
rappresentano tutti i giochi ammessi per 


mezzo di un albero, si vede che se en¬ 
trambi i giocatori non hanno una strate¬ 
gia vincente, allora ciascun giocatore ha 
una strategia per non perdere. 

Il teorema non si applica in modo im¬ 
mediato al gioco degli scacchi perchè 
non esistono regole precise per evitare 
che il gioco si prolunghi all’infinito. Sup¬ 
poniamo tuttavia che si possano intro¬ 
durre regole per escludere le partite di 
scacchi senza finè, senza imporre un li¬ 
mite al numero delle mosse permesse in 


una partita completa. Allora si potrebbe 
applicare agli scacchi una proposizione 
nota come lemma deH’infinito, che sta¬ 
bilisce che se esiste un numero infinito di 
rami connessi nell’albero di un gioco e 
da ciascun nodo parte solamente un nu¬ 
mero finito di rami, allora esiste un cam¬ 
mino infinito. 

Dato il lemma deU’infinito e assunte 
nuove regole che escludono le partite 
senza fine, segue che l’albero che rappre¬ 
senta il gioco degli scacchi ha solamente 





~ = NON 
v=0 
A = E 

x'= X + 1 
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(Ayx a Byx') v (Byx a Cyx') v (Cyx a Ayx') 


Axx 




3 

— (Axy a Bxy) v — (Bxy a Cxy) v — (Cxy a Axy) 



Le regole per i problemi del domino sono presentate nel simbolismo 
del linguaggio formale usato nella logica matematica (si veda il glossa¬ 
rio in alto a destra). In alto al centro c’è un insieme di domino: A, B e 
C. La prima espressione stabilisce che i colori devono corrispondersi 
nei bordi a sinistra e a destra, la seconda stabilisce che i colori devono 
corrispondersi nei bordi in alto e in quelli in basso. La terza regola 
dice che le tessere non possono essere collocate l’una sopra all’altra. 



La quarta è una delle tipiche limitazioni che vengono usate per 
complicare giochi nel tentativo di approssimare difficili problemi di 
calcolo. Essa stabilisce che solamente A può giacere sulla diagonale 
principale del piano. La posizione sul piano viene stabilita per mezzo 
di coordinate cartesiane. In designazioni come «Ayx» la posizione 
occupata della tessera sull’asse orizzontale è determinata dalla prima 
variabile, y, e la posizione sull'asse verticale dalla seconda variabile. 
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un numero finito di rami. Altrimenti, 
per il fatto che solamente un numero fi¬ 
nito di rami parte da ciascun nodo, do¬ 
vrebbe esistere un sentiero infinito (un 
gioco senza fine). Quindi c’è solo un nu¬ 
mero finito di possibili successioni di 
mosse e perciò il gioco degli scacchi è 
vano o ingiusto. 

La dimostrazione del lemma dell’infi¬ 
nito è abbastanza immediata. Si prenda 
l’ultimo nodo dell’albero. Poiché si sup¬ 
pone che ci sia un numero infinito di 
rami, ma da ciascun nodo ne parte solo 
un numero finito, almeno uno dei nodi 
del livello precedente deve essere la fine 
di un sottoalbero con un numero infinito 
di rami. Si chiami questo nodo X. Tutta¬ 
via per ipotesi da X parte solo un nume¬ 
ro finito di rami. Quindi uno dei nodi 
del livello precedente, rispetto a X, deve 
essere la fine di un sottoalbero infinito. 
Ripetendo il ragionamento si trova che a 
ogni livello c’è almeno un nodo che è la 
fine di un sottoalbero infinito e l’insieme 
di tutti questi nodi finali determina un 
sentiero infinito che attraversa l’albero. 
Un’applicazione antropomorfa del lem¬ 
ma dell’infinito potrebbe consistere nello 
stabilire che, se la specie umana non 
scomparirà mai, oggi esiste qualcuno che 
in ogni momento del futuro avrà un 
discendente. 

XT aturalmente si sceglie di esaminare 

^ un gioco a seconda dell’importanza 
dei problemi matematici a cui risulta le¬ 
gato. Nel 1960, mentre stavo studiando 
ai Bell Telephone Laboratories alcuni 
problemi di logica, inventai un nuovo 
solitario giocato con domino costituito 
da tessere colorate. Più recentemente, al¬ 
lo Harvard Computational Laboratory, 

10 e alcuni miei colleghi trovammo alcu¬ 
ne significative e sorprendenti applica¬ 
zioni di questo gioco. Alcuni problemi 
che sorgono nel gioco del domino sono 
esattamente analoghi ai problemi per cui 
sono progettate le macchine di Turing. 
Le condizioni sotto cui si svolge il gioco 
possono essere fatte corrispondere alle 
computazioni di macchine di Turing, 
quindi lavorando con i domino si può 
avere una nuova versione, alcune volte 
particolarmente illuminante, di alcuni 
problemi matematici. 

Nel gioco in questione viene dato un 
insieme finito di tessere quadrate (i do¬ 
mino); le tessere sono tutte della medesi¬ 
ma grandezza, ma ciascuna ha il bordo 
di un colore stipulato e i colori sono 
combinati in parecchi modi specificati. 
Si assuma di avere una infinità di copie 
di ciascun tipo di domino, e che non sia 
permesso ruotare un domino nel piano. 

11 gioco consiste nel coprire con tutte le 
tessere un piano infinito in modo tale 
che i bordi che combaciano abbiano il 
medesimo colore. Se si può coprire il 
piano con un dato insieme di domino, si 
dice che l’insieme è risolvibile. 

Si consideri l’insieme di tre tessere mo¬ 
strato nell’illustrazione di pagina 130. 
L’insieme è risolvibile perchè può essere 
raggruppato in blocchi di nove tessere 
che soddisfano la regola che riguarda i 


Si ricopra una sezione del piano cartesiano 
con tessere nere e bianche in modo tale 
che nessun blocco (deile dimensioni 
indicate qui a destra o più largo) abbia i 
bordi di sinistra e di destra, quelli in alto 
e quelli in basso che corrispondono, 
tsiste un metodo per ricoprire un piano 
infinito in questo modo? 


L’autore presenta al lettore quattro problemi di cui solo il secondo non ha soluzioni note. La 
soluzione del problema mostrato in questa figura si trova nell’illustrazione di pagina 137. 


È possibile srivere successioni di 0 e di 1 
in modo che producano una «progenie» per 
mezzo di queste regole: 

1. Se la stringa ha meno di tre simboli, 
stop. 

2. Se la stringa inizia con 0, si cancellino 
i primi tre simboli e si aggiunga 00 alla 
fine. 

3. Se la stringa inizia con 1, si cancellino i 
primi tre simboli e si aggiunga 1101 alla 
fine. 

Date due stringhe, esiste un algoritmo per 
determinare se una delle due è una 
progenie dell’altra? 


011010001001 

101110110011 

01000100100 

1101100111101 

0010010000 

11001111011101 

001000000 

011110111011101 

00000000 

11011101110100 

0000000 

111011101001101 

000000 

0111010011011101 

00000 

101001101110100 

0000 

0011011101001101 

000 

10110100110100 

00 

1101001101001101 

(stop) 

rcontinuazione della progenie) 


Il secondo problema consiste nel trovare un algoritmo che mostri se due stringhe di zero e di 
uno sono in una certa relazione. Il problema è complicato dal fatto che certe stringhe danno 
origine a progenie infinite. Una soluzione alternativa sarebbe mostrare che l'algoritmo non esiste. 


Esiste un algoritmo per decidere se 
un’equazione polinomiale a coefficienti 
interi ha radici intere? 

Le equazioni di questo tipo includono 

x ? - 4x + 3 = 0 

e 

a 2 + b 2 — c 2 = 0 . 

La prima equazione ha una sola incognita, 
x. Ha cioè la forma 

a„x"T a„-ix n 1 + ... + a,x + a 0 = 0 


e per tali equazioni l'algoritmo desiderato è: 

1. Si trovino tutti i divisori di a . 

2. Si sostituisca la x con ogni divisore di a 
e si calcolino i valori risultanti per il lato 
sinistro dell’equazione. 

3. Se qualche divisore porta al valore 0. 

è una radice. Se nessuno porta al valore 0. 
l’equazione non ha radici intere. 


Il problema consiste nell’ideare 
un algoritmo per le equazioni, come 
la seconda, che contengono 
più di una incognita. 


Il terzo problema è conosciuto come «decimo problema di Hilbert» poiché il matematico 
tedesco David Hilbert nel 1900 lo elencò come uno dei problemi rilevanti a cui la matematica si 
trovava di fronte. Per la soluzione si veda in questo volume l’articolo dedicato a questo problema. 

EHEH 
HHBH 

Il problema dei dieci domino sta nel disporre le tessere in modo che lo schema dei colori 
sia lo stesso per i bordi in alto, in basso, a sinistra e a destra. La soluzione alla pagina seguente. 
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Soluzione del primo problema di pagina 135. Per ricostruire la soluzione, sia a un pezzo nero e 
b uno bianco (a sinistra). Si scriva a e lo si sostituisca con ab. Si sostituisca b con ba e si 
continui a sostituire a e b in questo modo. Si trascriva la successione sulla riga in alto del 
piano e si copi ogni simbolo lungo la diagonale dall’alto a destra fino in basso a sinistra. 


bordi e che possono essere ripetuti in 
ogni direzione. Data una soluzione per 
l’intero piano, è possibile ovviamente ta¬ 
gliare via tre settori quadrati (o quarti) 
per ottenere la soluzione di un settore 
quadrato. Il viceversa è meno ovvio, ma 
si può stabilire con l’aiuto del lemma 
deH’infinito. Poiché esiste la soluzione 
per un settore quadrato infinito, esistono 
soluzioni parziali per i suoi settori qua¬ 
drati, soluzioni di ogni area di n per n. A 
partire da tali soluzioni parziali è possi¬ 
bile disegnare un albero infinito e mo¬ 
strare per mezzo del lemma dell’infinito 
che nell’albero esiste un cammino infini¬ 
to che produce la soluzione per l’intei'o 
piano. Quindi, se è possibile riempire un 
settore quadrato del piano infinito, è 
possibile riempire l’intero piano. 

C i possono usare queste tessere per si- 
mulare varie macchine di Turing e 
per creare un equivalente del famoso 
problema dell’arresto (halting problem) 
formulato da Turing. 

Questo si può fare più facilmente se si 
specifica quale domino deve essere mes¬ 
so all’origine del piano, cioè quale domi¬ 
no deve essere collocato per primo. Con 
maggior difficoltà si può ottenere lo stes¬ 
so risultato o specificando che certi do¬ 
mino occorrono sulla diagonale princi¬ 
pale, o omettendo qualsiasi restrizione 
all’infuori di quelle menzionate prima. 
Consideriamo questa equivalenza tra il 
problema dell’arresto e il gioco del do¬ 
mino in maggior dettaglio. 

Turing ideò il suo semplice calcolatore 
per riprodurre l’operazione di calcolo ef¬ 
fettuata dall’uomo. Un uomo che risolve 
problemi matematici è probabile che usi 
carta e matita per scrivere e cancellare i 
numeri; può inoltre avere una collezione 
di fatti matematici sotto forma di un 
libro di tavole e, contenuto nella sua 
mente o nel suo libro, un insieme di 
istruzioni per eseguire i passi adeguati 
nella successione adeguata. Anche l’im- 
maginaria macchina di Turing ha un di¬ 
spositivo per stampare e uno per can¬ 
cellare i numeri secondo le istruzioni che 
provengono da una unità di controllo 
logica che segue una tavola di comandi 
predisposti in anticipo. I numeri vengo¬ 
no scritti sotto forma di singole sbarre su 
celle quadrate di un nastro infinitamente 
lungo che serve come unità di memoria. 
(Poiché nessuna macchina reale può ave¬ 
re una memoria infinita, la macchina di 
Turing è una idealizzazione.) 

Una cella del nastro, a un dato tempo, 
viene esaminata da un dispositivo di e- 
splorazione che fornisce all’unità di con¬ 
trollo il simbolo stampato sulla cella (si 
veda l’illustrazione in basso a pagina 
132). L’unità di controllo quindi consulta 
le istruzioni interne per mezzo di un qua¬ 
drante che indica la posizione designata 
«istruzione corrente». A seconda del sim¬ 
bolo in esame, l’istruzione specifica uno 
dei quattro ordini seguenti: (1) si stampi 
un contrassegno sulla cella, cancellando se 
necessario; (2) si muova il nastro di una 
cella a destra; (3) si muova il nastro di 
una cella a sinistra; (4) alt! L’istruzione 
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indica quindi la posizione dell’istruzione 
successiva. Si può dotare una macchina 
di Turing del numero necessario di posi¬ 
zioni delle istruzioni e del numero neces¬ 
sario di ordini, come pure di un nastro 
con un numero infinito di celle, per ri¬ 
solvere qualsiasi problema matematico 
.(che appartenga alla classe dei problemi 
risolvibili per mezzo di algoritmi). 

Turing ideò il problema dell’arresto 
come esempio di problema per il quale 
nessun programma poteva produrre tutte 
le soluzioni corrette: formulando un pro¬ 
blema che riguardava tutte le macchine 
di Turing possibili superò le capacità di 
qualsiasi singola macchina di Turing. Di¬ 
mostrò che sebbene ciascuna macchina, 
a seconda del suo nastro, si arresti a un 
certo momento o continui a operare inde- 
finitivamente, non esiste nessun algorit¬ 
mo generale per determinare questo com¬ 
portamento, ossia non esiste nessun me¬ 
todo equivalente a quello che determina 
chi è il vincitore nel nim. Ora è possibile 
trovare, per ciascuna macchina di Tu¬ 
ring, un insieme di tessere del domino 
tali che la macchina si ferma se e solo se 
l’insieme di tessere non ha soluzione. Si 
ricava immediatamente che il problema 
del domino è irrisolvibile. Se si potesse 
risolvere il problema del domino, si po¬ 
trebbe risolvere il problema dell’arresto, 
quindi il problema del domino non si 
può risolvere. In altre parole, non esiste 
un metodo generale per decidere se un 
qualsiasi insieme di tessere ha una solu¬ 
zione. 

Il problema del domino è un esempio 
di «problema di decisione infinito», un 
problema che compare frequentemente 
in logica, nella teoria dei calcolatori e in 
generale in matematica. Si tratta di un 
problema infinito nel senso seguente: 
qualsiasi soluzione al problema del do¬ 
mino deve consistere in un singolo meto¬ 
do che fornisca la risposta corretta (si o 
no) a un numero infinito di problemi 
della forma: «Un certo insieme di tessere 
ricopre il piano?» Mentre qualsiasi dato 
insieme di tessere del domino è finito, 
esiste naturalmente un insieme infinito di 
tali insiemi e quindi un numero infinito 
di problemi. 

J n questo modo si sono ridotti i proble¬ 
mi riguardanti insiemi di tessere del 
domino a problemi riguardanti macchine 
e si sono stabiliti i risultati riguardanti i 
domino facendo appello ai risultati co¬ 
nosciuti riguardanti le macchine. Il passo 
successivo consiste nel ridurre il proble¬ 
ma dell’interpretazione di una formula 
in logica al problema che riguarda la 
soluzione di un insieme di tessere. Poi¬ 
ché il fatto che un insieme di tessere ha 
una soluzione può essere espresso in lo¬ 



La soluzione del problema dei dieci domino è un blocco rettangolare di 36 domino, due dei 
quali sono separati da una linea nera pesante che attraversa il centro deU’illustrazione. La 
soluzione non è unica in quanto sono possibili e ugualmente accettabili altre configurazioni. 


gica per mezzo di una semplice formula, 
questa riduzione fornisce una risposta a 
un importante problema di decisione nel¬ 
l’ambito della logica. 

Se si desidera esprimere la condizione 
che un insieme di tre tessere del domino 
ha una soluzione nel primo quadrante 
del piano infinito, basta riferirsi alle fa¬ 
miliari coordinate cartesiane per deter¬ 
minare la posizione dei domino nel qua¬ 
drante e rappresentare ciascun domino 
per mezzo di un predicato, Axy percorre 
nella posizione (x, y ). Se si scrive x' per 
x+1, la condizione richiesta può essere 
data per mezzo di un certo numero di 
clausole che richiedono pochissimi quan¬ 
tificatori (ossia espressioni del tipo «per 
tutti gli x» e «esiste almeno un x»). 
Siamo generosi solamente con le opera¬ 
zioni finite della logica formale, quali 
«non», e «e», e «o» (si veda l’illustrazio¬ 
ne di pagina 134). Si conclude che per 
ogni insieme di tessere dato si può trova¬ 
re una corrispondente «formula AEA» 
(una proposizione che inizia con «Per 
tutti gli x, esiste un y, tale che per tutti 
gli z..., seguita da una combinazione 
logica di predicati senza quantificatori) 
tale che l’insieme ha una soluzione se e 
solo se la formula non è autocontraddit¬ 
toria. In altre parole, si può tradurre un 
problema riguardante il domino in una 
formula logica specificando certe restri¬ 
zioni, e quindi determinare se l’insieme 
di tessere è risolvibile guardando se la 
formula è o non è autocontraddittoria. 
Quindi, poiché il problema generale del 
domino non è risolvibile, non esiste nes¬ 
sun metodo generale per decidere se una 
arbitraria formula AEA è autocontrad¬ 
dittoria. 

Si tratta di un risultato utile perchè in 


logica la complessità delle formule è spes¬ 
so misurata per mezzo del numero e del¬ 
l’ordine dei quantificatori e le formule 
sono spesso poste in classi differenti a 
seconda dei quantificatori che vi com¬ 
paiono. È sorprendente che una classe 
semplice come quella delle formule AEA 
(con tre quantificatori soltanto) sia inde¬ 
cidibile. Infatti, con questo risultato si 
possono risolvere i problemi di decisione 
per tutte le classi di quantificatori. Data 
una qualsiasi successione di quantifica¬ 
tori si può ora dire se la classe di formu¬ 
le determinata da essa è decidibile. 

Il problema della decidibilità della lo¬ 
gica è interessante perché tutte le teorie 
matematiche possono essere formulate 
nei termini della logica elementare. Il 
problema che riguarda il fatto che una 
formula ( F) possa o non possa essere 
derivata da un insieme di assiomi (A) si 
riduce al problema di decidere se la for¬ 
mula logica «A ma non E» non sia auto¬ 
contraddittoria. In questo senso tutta la 
matematica è riducibile alla logica. Infatti 
la misura della complessità di un proble¬ 
ma matematico è data dalla struttura 
della formula logica corrispondente. È 
quindi un compito importante determi¬ 
nare la complessità delle varie classi di 
formule logiche. 

Si può legittimamente dire che tutta la 
matematica può essere ridotta, per mez¬ 
zo delle macchine di Turing, a un solita¬ 
rio giocato con le tessere di questo domi¬ 
no. In molti casi la riduzione non rende 
più facile la trattazione di un problema 
matematico, tuttavia la dimostrazione che 
certi problemi non sono risolvibili da un 
calcolatore può essere facilitata riducen¬ 
doli a problemi riguardanti le tessere del 
domino. 
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Il decimo problema di Hilbert 

E possibile determinare una procedura che indichi se esistono soluzioni 
di un equazione diofantea? Oggi finalmente è stata data una risposta 
a tale domanda che faceva parte di un celebre elenco di problemi 

di Martin Davis e Reuben Hersh 


«^l enfiamo in noi l’eterno richiamo: 
ecco il problema, cercarne la so- 
luzione. È possibile ricavarla fa¬ 
cendo appello solo alla ragione, dal 
momento che in matematica non esiste 
ignorabimus [ossia problemi non riso¬ 
lubili], » In tal modo David Hilbert 
inaugurò il secondo Congresso inter¬ 
nazionale dei matematici, tenuto a Pa¬ 
rigi l’otto agosto 1900, salutando l’ini¬ 
zio del nuovo secolo con la presenta¬ 
zione di un elenco di 23 importanti 
problemi come sfida per i futuri ma¬ 


tematici. Alcuni dei problemi proposti 
da Hilbert rimangono ancora insoluti; 
altri hanno ispirato generazioni di ri¬ 
cercatori e hanno portato a nuove e 
importanti teorie matematiche. L’ulti¬ 
mo risultato sui problemi di Hilbert ri¬ 
guarda il decimo, che è stato risolto 
nel 1970 dal matematico russo venti¬ 
duenne Yuri Matyasevich. 

David Hilbert nacque a Kònigsberg 
nel 1862 e fu professore all’Università 
di Gottinga dal 1895 fino alla sua mor¬ 
te avvenuta nel 1943; venne considera¬ 


to, dopo la morte di Henri Poincaré 
nel 1912, come il più importante ma¬ 
tematico del suo tempo. Diede contri¬ 
buti fondamentali in molte discipline, 
ma forse è ricordato soprattutto per il 
suo sviluppo del metodo astratto quale 
potente strumento per la matematica. 

È molto facile descrivere il decimo 
problema di Hilbert. Esso riguarda la 
piu semplice e fondamentale attività 
matematica: risolvere equazioni. Le 
equazioni da risolvere sono polinomi¬ 
nali, cioè del tipo x 2 - 3xy = 5, costi- 


y 



I grafici delle due equazioni mettono in luce la differenza fra 
un’equazione usuale e un’equazione diofantea in cui ci si oc¬ 
cupa solo delle soluzioni intere; tale differenza è sostanziale 
per formulare il decimo problema di Hilbert. Le equazioni in 
questione sono xr + y 2 — 2 = 0 (a sinistra) e x 2 + y 2 — 3 = 0 ( a 
destra ); entrambe sono rappresentate con circonferenze il cui 
centro è sull’origine, cioè sul punto di coordinate x = 0, y = 0. 
Nel caso di x 1 + y 7 — 2 = 0 la circonferenza ha un raggio di va¬ 
lore -\[2. Se l’equazione viene considerata nel modo usuale, vi 


y 



saranno infinite soluzioni. Se invece è vista come equazione dio¬ 
fantea, ve ne saranno solo quattro: 1) x = 1, y — 1, 2) x = —1, 
y = 1, 3) x = 1, y — — 1 e 4) x = — 1, y = — 1. Tali soluzioni 
sono state messe in evidenza là dove il grafico passa per i quat¬ 
tro punti le cui coordinate sul reticolato cartesiano sono quel¬ 
le sopra specificate. Nel caso di x 2 + y 2 — 3 = 0 la circonferenza 
ha un raggio di valore V"3- Considerata come un’equazione usua¬ 
le essa ha un numero infinito di soluzioni; se viene considerata 
come un’equazione diofantea non può avere alcuna soluzione. 
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tuite da somme e prodotti di costanti 
e variabili, e in cui compaiono espo¬ 
nenti interi positivi. Oltre a ciò, Hilbert 
richiese che le equazioni dovessero far 
uso solo di numeri interi (positivi o ne¬ 
gativi): né i numeri irrazionali né quel¬ 
li immaginari e neppure le frazioni so¬ 
no ammessi sia nelle equazioni sia nel¬ 
le loro soluzioni. Equazioni di questo 
genere sono dette diofantee da Diofan- 
to di Alessandria che scrisse un libro 
su tale argomento nel terzo secolo. 

Il decimo problema di Hilbert è al¬ 
lora: descrivere una procedura mecca¬ 
nica grazie alla quale sia possibile sag¬ 
giare ogni equazione diofantea per de¬ 
cidere se possiede soluzioni. Con le pa¬ 
role di Hilbert: « Data un’equazione 
diofantea con qualunque numero di 
quantità incognite e con coefficienti 
numerici interi razionali, escogitare un 
procedimento in base al quale sia pos¬ 
sibile determinare, con un numero fini¬ 
to di operazioni, se l’equazione ammet¬ 
ta soluzioni razionali. » La richiesta di 
Hilbert non riguarda un procedimen¬ 
to per trovare le soluzioni ma sempli¬ 
cemente per determinare se l’equazio¬ 
ne ne possegga. Tale procedura deve 
essere formalmente dettagliata in mo¬ 
do da poter essere programmata per 
una macchina calcolatrice e utilizzata 
in tutti i casi possibili: procedimenti di 
questo genere sono detti algoritmi. 

Se il problema di Hilbert è semplice 
a formularsi, ancor piu facile è formu¬ 
lare la soluzione di Matyasevich: non 
è possibile escogitare una procedura di 
questo tipo; un algoritmo siffatto non 
esiste. Cosi espressa, la soluzione suo¬ 
na negativa in modo scoraggiante. In 
realtà, il risultato di Matyasevich costi¬ 
tuisce un importante contributo alla co¬ 
noscenza delle proprietà dei numeri. 

11 lavoro di Matyasevich estende una 
serie di ricerche di tre americani: uno 
degli autori (Davis), Julia Robinson e 
Hilary Putnam. A loro volta, i lavori 
di questi ultimi erano basati su prece¬ 
denti ricerche di molti dei fondatori 
della logica moderna e della teoria del¬ 
la computabilità: Alan Turing, Emil 
Post, Alonzo Church, Stephen Kleene 
e lo stesso Kurt Godei, celebre per i 
suoi risultati sulla consistenza dei si¬ 
stemi assiomatici (secondo problema di 
Hilbert) e sull’ipotesi del continuo di 
Cantor (primo problema di Hilbert). 

Tniziamo l’esposizione del decimo pro¬ 
blema di Hilbert analizzando al¬ 
cune equazioni diofantee. La locu¬ 
zione « equazione diofantea » è in par¬ 
te fuorviante dal momento che a es¬ 
sere cruciale non è tanto la natura 
dell’equazione quanto quella delle so¬ 
luzioni ammesse. Per esempio, l’equa¬ 
zione x 2 + y 2 — 2 = 0, se non la si con¬ 



fina macchina a luce verde e rossa è un dispositivo ideale che esamina numeri per de¬ 
terminare se siano o meno elementi di un insieme dato. Il decimo problema di Hilbert 
consiste nel chiedersi se sia possibile costruire una « macchina di Hilbert » a luce verde 
e rossa per saggiare se le equazioni diofantee abbiano o meno soluzioni. Nel caso del¬ 
l’esame compiuto sui numeri per determinare la loro appartenenza a un insieme, si ac¬ 
cende la luce verde se la macchina e stata in grado di stabilire in un numero finito 
di passi che un certo ingresso è elemento dell’insieme. Se per esempio Sèi insieme di 
tutti i numeri pari, si può trovare un algoritmo che divida ogni ingresso x per 2. Se il 
resto è 0 la macchina accenderà la luce verde indicando che * è un elemento di S. 



La luce rossa si accenderà nella macchina a luce verde e rossa se essa è stata in gra¬ 
do di determinare che l’ingresso non è elemento dell’insieme. Se 1 ingresso a; è il 
numero intero 23, diviso per 2 dà un resto 1, quindi 23 non è elemento di S. Il 
complemento di S è S, l’insieme dei numeri dispari. Poiché si può costruire una macchi¬ 
na a luce verde e rossa per separare gli elementi di S da quelli di S, S è computabile. 
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Una macchina a luce verde e rossa per l’insieme S può essere 
Irasformata in una macchina a luce verde per S (cioè una mac¬ 
china che si accende solo quando l’ingresso è un elemento di 
S) più una macchina a luce verde per S, il complemento di S. 
La dimostrazione è semplice. Per costruire una macchina a lu¬ 
ce verde per S, è sufficiente svitare la lampada rossa della mac¬ 


china a Juce verde e rossa. Per costruire una macchina a luce ver¬ 
de per S, occorre svitare la lampada verde della macchina a luce 
verde e rossa e porla nello zoccolo in cui vi era la lampada rossa. 
In altri termini: se un insieme (come S, l’insieme dei nume¬ 
ri pari) è computabile allora sia tale insieme sia il suo comple¬ 
mento (come S, l’insieme dei numeri dispari) sono elencatoli. 
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Le macchine a luce verde per S e per S possono essere utilizzate 
per costruire una macchina a luce_verde e rossa per l’insieme S. 
Nella macchina a luce verde per S si sostituisca la lampada ver¬ 


de con una lampada rossa e si colleghino le due macchine in pa¬ 
rallelo di modo che uno stesso ingresso valga simultaneamente 
per entrambe. Il risultato sarà ovviamente una macchina a lu- 
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sidera come equazione diofantea, ha 
infinite soluzioni. Esse possono venir 
rappresentate mediante il grafico del¬ 
l’equazione che è una circonferenza 
nel piano formato dagli assi delle x e 
delle y. Il centro di tale circonferenza 
ha le coordinate x = 0 e y = 0: tale 
punto è detto origine ed è abbreviato 
con (0,0). Il raggio della circonferenza 
è spi (si veda l’illustrazione della pa¬ 
gina 138). Le coordinate di ogni pun¬ 
to sulla circonferenza soddisfano la 
equazione e vi è un numero infinito di 
tali punti. Tuttavia, se consideriamo il 
problema dal punto di vista di un’equa¬ 
zione diofantea, vi sono solo quattro 
soluzioni: 1) x = 1, y = 1; 2) x = — 1, 
j>=l;3)jc=l,y = — 1 e 4) x = — 1, 
y = — 1- 

Si supponga di modificare l’equazio¬ 
ne in x 2 + y 2 — 3 = 0. Vi sarà ancora 
un numero infinito di soluzioni se la 
consideriamo come un’equazione usua¬ 
le, ma nessuna soluzione del tutto se 
la consideriamo come una equazione 
diofantea. La ragione sta nel fatto 
che ora il grafico è una circonferenza 
il cui raggio è e nessun punto di 
tale curva ha le coordinate simultanea¬ 
mente uguali a un numero intero. 

Una famiglia molto nota di equazio¬ 
ni diofantee ha la forma x" + y n = z", 
con n uguale a 2, 3, 4 o a qualsiasi in¬ 
tero maggiore. Se n è uguale a 2, la 



ce verde e rossa. In altri termini : se sia 
un insieme sia il suo complemento sono 
elencabili, allora l’insieme è computabile. 


equazione è soddisfatta dalle lunghez¬ 
ze dei lati di ogni triangolo rettangolo 
ed è chiamata teorema di Pitagora. 
Una di tali soluzioni è l’insieme dei nu¬ 
meri x = 3, y = 4, z = 5. Se n è ugua¬ 
le o maggiore di 3, l’equazione è nota 
sótto il nome di equazione di Fermat. 
Il matematico francese del diciassette¬ 
simo secolo Pierre de Fermat ritenne 
di aver dimostrato che tali equazioni 
non hanno soluzioni intere positive. Sul 
margine della sua copia del libro di 
Diofanto egli scrisse di avere trovato 
una « dimostrazione veramente mira¬ 
bile » che sfortunatamente era troppo 
lunga per poter essere scritta in quel¬ 
lo spazio. La dimostrazione (ammesso 
che in realtà Fermat ne avesse trovato 
una) non è mai stata scoperta. Noto 
sotto il nome di ultimo teorema di Fer¬ 
mat, è probabilmente il più antico e 
famoso dei problemi matematici non 
risolti. Questi esempi mostrano come 
le equazioni diofantee siano facili a 
scriversi ma difficili a risolversi; e sono 
cosi difficili a risolversi proprio perché 
sono cosi esclusive nei riguardi del ti¬ 
po di numeri accettati come soluzioni. 

Per quanto riguarda le equazioni di 
primo grado, cioè le equazioni in cui 
le incognite non vengono moltiplica¬ 
te fra loro e tutti gli esponenti so¬ 
no eguali a 1, come per esempio 
Ix + 4y — 3z — 9 9t + 13u — 10 = 0, 
l’esistenza di soluzioni può essere de¬ 
terminata mediante un metodo di di¬ 
visione noto fin dall’antichità come 
algoritmo di Euclide. Per le equazio¬ 
ni di secondo grado a due incogni¬ 
te, come 3x 2 — 5y 2 + 7 = 0 oppure 
x 2 — xy — y 2 = 1, una teoria, sviluppa¬ 
ta all’inizio del diciannovesimo secolo 
dal grande Karl Friedrich Gauss, per¬ 
mette di stabilire se vi siano soluzioni. 
Recenti lavori del giovane matematico 
inglese Alan Baker hanno gettato una 
considerevole luce sulle equazioni a 
due incognite di grado superiore al se¬ 
condo. Per quanto concerne le equa¬ 
zioni di grado superiore al primo e che 
abbiano più di due incognite, vi sono 
solo alcuni casi speciali che possono 
essere trattati con particolari artifici, 
ma per il resto ci troviamo in un va¬ 
sto mare di ignoranza. 

perché è cosi difficile trovare un pro¬ 
cedimento del tipo di quello richie¬ 
sto da Hilbert? L’approccio più diret¬ 
to sarebbe semplicemente quello di spe¬ 
rimentare tutti i possibili insiemi di va¬ 
lori delle incognite, uno dopo l’altro, 
fino a trovare una soluzione. Per esem¬ 
pio, se l’equazione ha due incognite, si 
potrebbe fare un elenco di tutte le 
coppie di interi. A questo punto baste¬ 
rebbe semplicemente procedere lungo 
l’elenco, provando una coppia dopo 


l’altra, per vedere se soddisfa l’equazio¬ 
ne. Questa è certamente una procedu¬ 
ra dettagliata e meccanica che potreb¬ 
be essere espletata da una macchina. 
Quale sarebbe però il risultato? 

Se l’equazione è la prima che abbia¬ 
mo menzionato, cioè x 2 + y 2 — 2 = 0, 
si devono provare (0,0), (0,1), (1,0), 
(0,—1), (—1,0) e scartarle tutte. La 
possibilità successiva, (1,1), è una so¬ 
luzione. Siamo stati fortunati: sono sta¬ 
te considerate solo sei coppie. Se invece 
l’equazione fosse x 2 + y 2 = 20 000, si 
dovrebbero provare migliaia di coppie 
di numeri prima di giungere a una so¬ 
luzione. In ogni caso è chiaro che se 
esiste una soluzione essa verrà trovata • 
in un numero finito di passi. 

D’altro canto, che cosa si può di¬ 
re riguardo alla seconda equazione: 
x 2 + y 2 — 3 = 0? Si possono provare 
per tutta l’eternità nuove coppie di in¬ 
teri e tutto quello che si potrà sempre 
sapere sarà che non si è ancora riusciti 
a trovare una soluzione. Ma non si riu¬ 
scirebbe mai a stabilire se la coppia 
successiva potrebbe o meno essere una 
soluzione. Per questo esempio partico¬ 
lare è possibile dimostrare che non vi 
sono soluzioni: ma tale dimostrazione 
richiede considerazioni di nuovo tipo, 
non può cioè essere ottenuta semplice- 
mente mediante successive sostituzioni 
di interi nell’equazione. 

Un meccanismo, in grado di svolge¬ 
re un procedimento del tipo suggerito 
da Hilbert, dovrebbe accettare come 
possibile ingresso (input) i coefficienti 
di una qualsivoglia equazione diofan¬ 
tea. Come possibile uscita (output) si 
accenderebbe una luce verde nel caso 
che l’equazione abbia una soluzione, 
una luce rossa in caso contrario. Una 
macchina di questo tipo potrebbe ve¬ 
nir chiamata macchina di Hilbert. Vi¬ 
ceversa, una macchina, che semplice- 
mente ricerca soluzioni mediante suc¬ 
cessivi tentativi ad infinitum, potrebbe 
essere descritta nei termini di una mac¬ 
china a luce verde. Se l’equazione pos¬ 
siede una soluzione, la luce verde si ac¬ 
cenderà dopo un numero finito di pas¬ 
si. Se l’equazione non ha soluzioni, si 
avrà semplicemente che il calcolo pro¬ 
seguirà per sempre; a differenza della 
macchina di Hilbert, quella a luce ver¬ 
de non ha alcun modo per stabilire 
quando deve fermarsi. 

È facile costruire una macchina a 
luce verde per le equazioni diofantee. 
Il problema è se sia possibile far di 
meglio e costruire una macchina di 
Hilbert, cioè una macchina a luce ver¬ 
de e rossa, che si fermi sempre dopo 
un numero finito di passi e fornisca 
una risposta definitiva, positiva o nega¬ 
tiva. Ciò che ha dimostrato Matj'ase- 
vich è che questo non potrà mai venir 
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Le coppie di interi possono essere singo¬ 
larmente saggiate da una macchina a luce 
verde per stabilire se siano soluzioni di 
equazioni diofantee. Nel caso dell’equazio¬ 
ne x 1 + y 2 — 2 = 0, dopo i primi insuc¬ 
cessi, al sesto tentativo si giunge a una 
soluzione (in alto). Invece la macchi¬ 
na a luce verde che saggia l’equazióne 
x 1 + y 1 — 3 = 0 non ha alcun modo di sta¬ 
bilire quando dovrà fermarsi dal momen¬ 
to che non vi sono soluzioni intere (in 
basso). Tutto ciò che può sapere è che 
per il momento non ha trovato soluzioni. 


fatto. Anche se concediamo alle mac¬ 
chine una capacità di memoria e un 
tempo di calcolo illimitati, non potrà 
mai venir compilato alcun programma 
né costruita alcuna macchina che com¬ 
piano ciò che era richiesto da Hilbert. 

Nella sua allocuzione del 1900, Hil¬ 
bert continuava in questo modo: «Ta¬ 
lora può capitare che si cerchi una so¬ 
luzione sotto ipotesi insufficienti o in 
un senso non corretto ed è per questo 
che non si ha successo. Sorge allora il 
problema: dimostrare l’impossibilità 
della soluzione sotto le ipotesi date o 
nel senso stabilito. » Questo è esatta¬ 
mente ciò che è avvenuto con il deci¬ 
mo problema. Per spiegare come sia 
possibile sapere che non esiste alcuna 
macchina di Hilbert, dovremo svolgere 
alcune semplici considerazioni riguar¬ 
do alla computabilità. Supponiamo che 
S indichi un insieme di interi. S è 
« elencabile » se può essere costruita 
una macchina a luce verde che rispon¬ 
da al seguente scopo: accetti come in¬ 
gresso qualunque intero e come uscita 
accenda una luce verde dopo un nu¬ 
mero finito di passi se e solo se l’in¬ 
gresso (cioè l’intero) appartiene a S. 
Per esempio, l’insieme dei numeri pari 
è elencabile: in tal caso la macchina 
dovrà dividere l’ingresso per 2 e accen¬ 
dere la luce verde se il resto è 0. In 
matematica gli insiemi di questo tipo 
vengono detti ricorsivamente enumera- 
bili; la parola « elencabile » è una no¬ 
stra espressione non formale ma usata 
in senso equivalente. 

L’insieme S è « computabile » se 
può essere costruita una macchina a 
luce verde e rossa (analoga alla mac¬ 
china di Hilbert) con un compito più dif¬ 
ficile: accettare ogni intero come ingres¬ 
so e, dopo un numero finito di passi, ac¬ 
cendere la luce verde se l’intero è in S, 
la luce rossa se l’intero non è in S. Per 
esempio, l’insieme dei numeri pari è 
anche computabile: la macchina dovrà 
dividere l’ingresso per 2 e se il resto è 
0 accenderà la luce verde, quella rossa 
se invece è 1 (si vedano le illustrazioni 
a pagina 139). 

Vi è uno stretto collegamento fra 
queste due definizioni. Per chiarire ciò, 
si supponga che ~S indichi il comple¬ 
mento di S, cioè l’insieme di tutti gli 
interi che non appartengono a S. Se, 
nei due esempi dati, S è l’insieme de¬ 
gli interi pari, allora S sarà l’insieme 
degli interi dispari. Si può dimostrare 
che se S è computabile allora sia S sia 
S saranno elencabili. Per dirla in altri 
termini: se esiste per S una macchina 
a luce verde e rossa allora esistono una 
macchina a luce verde per S e una 
macchina a luce verde per ~S. La dimo¬ 
strazione è semplice. Per costruire una 
macchina a luce verde per S, basta svi¬ 


tare la lampada rossa della macchina 
a luce verde e rossa. Per costruire una 
macchina a luce verde per S, è suffi¬ 
ciente svitare la lampada verde della 
macchina di Hilbert e porla nello zoc¬ 
colo in cui vi era la lampada rossa. 

È vera anche l’affermazione inversa: 
se S e S sono elencabili, allora S è com¬ 
putabile. In modo equivalente si può 
dire: se esiste una macchina a luce ver¬ 
de sia per S sia per S , allora può esse¬ 
re costruita per S una macchina a lu¬ 
ce verde e rossa. È facile fare questo: 
si sostituisca, nella macchina a luce 
verde per S, la lampada verde con una 
rossa e quindi si colleghino in paralle¬ 
lo le due macchine, di modo che uno 
stesso ingresso valga simultaneamente 
per entrambe. Il risultato è ovviamen¬ 
te una macchina a luce verde e rossa. 

Tratte queste considerazioni, possiamo 
ora stabilire uno dei fatti cruciali 
della teoria della computabilità che ha 
un ruolo centrale nella soluzione del 
decimo problema di Hilbert: esiste un 
insieme K elencabile ma non compu¬ 
tabile! Esiste cioè una macchina a lu¬ 
ce verde per K ma non è possibile co¬ 
struire una macchina a luce verde per 
K, il complemento di K. 

Al fine di dimostrare questo asserto 
a prima vista singolare, si supponga 
che ogni macchina a luce verde sia de¬ 
terminata da un dettagliato « libretto 
di istruzioni » redatto in lingua italia¬ 
na che descriva esattamente il modo in 
cui è costruita la macchina. Questi li¬ 
bretti possono essere ordinati e nume¬ 
rati nella successione 1, 2, 3 e cosi via. 
In tal modo risultano numerate tutte 
le macchine a luce verde; M 1 sia la pri¬ 
ma macchina, M 2 la seconda, eccetera. 
In questo ragionamento è celato un ar¬ 
gomento piuttosto sottile: non sarebbe 
possibile avere un elenco ordinato di 
questo tipo per i libretti di istruzioni 
delle macchine a luce verde e rossa. 
La difficoltà consiste nel fatto che non 
è possibile stabilire sulla base del libret¬ 
to se, per ogni ingresso posto nella 
macchina che gli corrisponde, si accen¬ 
derà la luce verde o la luce rossa. 

L’insieme K è definito come l’insie¬ 
me dei numeri n tali che l’rc-esima 
macchina si accende se le viene posto 
in ingresso il numero n stesso. In al¬ 
tre parole, il numero 1 appartiene a K 
se e solo se M 1 accende la propria luce 
verde quando « 1 » viene posto in in¬ 
gresso: il numero 2 appartiene afse 
e solo se M 2 giunge ad accendersi do¬ 
po che « 2 » le è stato posto in ingres¬ 
so e così via (si veda l’illustrazione in 
alto della pagina a fronte). 

Per costruire una macchina a luce 
verde per K occorre, oltre alla biblio¬ 
teca dei libretti di istruzioni, un omet- 
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L’insieme K è elencabile, esiste cioè una macchina a luce ver¬ 
de per K. Si numerino tutte le possibili macchine a luce verde: 
Mi sia la prima macchina, M 2 la seconda, M 3 la terza e cosi via 
fino all’re-esima macchina. K è l’insieme dei numeri re tali che 


l’n-esima macchina si accende se le si pone in ingresso il nu¬ 
mero re. Nell’illustrazione un ometto ha posto in ingresso nella 
macchina M 3 - 8 i il numero 3781 e la luce verde si è accesa, indi¬ 
cando che il numero intero 3781 è un elemento dell’insieme K. 
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L’insieme K non è computabile, non esiste cioè alcuna macchi¬ 
na a luce verde per K , il complemento di _K. Si supponga che 
vi sia una tale macchina a luce verde per K. Dal momento che 
K è il complemento di K , ne scende che per ogni ingresso, per 
esempio 297, tale macchina si accenderà se e_solo se M 2 v non 
si accende per 297. Quindi la macchina per K non è certamen¬ 


te M 297 . Per le stesse ragioni non potrà coincidere con nessuna 
M n per ogni altro valore di n. Quindi non esiste alcuna macchi¬ 
na a luce verde per K e cioè K non è elencabile. Un insieme 
elencabile, il cui complemento non lo sia, non è computabile; 
quindi non si può costruire per esso alcuna macchina a luce ver¬ 
de e rossa, ossia non vi è nessun algoritmo per separare K da K. 
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I numeri di Fibonacci vennero scoperti nel 1202 da Leonardo Pisano. La successione 
è ottenuta iniziando con 1, quindi ancora 1 e poi sommando gli ultimi due numeri per 
ottenere il successivo. Tale successione cresce in modo esponenziale: l’/i-esimo numero è 
in via approssimata proporzionale all’n-esima potenza del numero reale [(1 + ^5 )/2]". 


PROBLEMA: Trovare il più piccolo numero n che diviso per 10, 3, 7 e 11 
abbia come resti rispettivamente 4, 2, 3 e 1. 

SOLUZIONE: Sia x il numero cercato. « Res » sia un’abbreviazione per 
« Il resto di... ». È possibile riformulare il problema scrivendo: 


Res | 

(-Ter) 

1 = 4 

Res | 

C-f) 

Res | 

m 

1 = 2 

Res | 

(■*) 


Per determinare x si devono risolvere quattro problemi ausiliari per delle 
nuove incognite y u y 2 , y 3 e y 4 . In ogni caso il numeratore è ottenuto 
moltiplicando fra loro tre dei divisori mentre il denominatore è il quarto. Per 
esempio, nella prima equazione in y } il numeratore 231 è uguale 3 X 7 X 11, 
mentre 10 è posto come denominatore: 

Res (- T) = 4 ’ Vi <10 Res (- 33 ° y3 ) = 3, 

Res (- 1 ) =2, y 2 < 3 Res (-^) = 1, 

L’insieme dei più piccoli interi che siano soluzioni di queste equazioni 
ausiliarie è y, = 4, y 2 = 1, y 3 = 3 e y t = 1. 

Per ottenere x (il numero cercato inizialmente) vengono sommati insieme i 
numeratori delle quattro equazioni ausiliarie: 

x = (231y,) + (770y 2 ) + (330y 3 ) + (21 Oy.) 

= (231 X 4) + (770 X 1) + (330 X 3) + (210 X 1) 

= 924 + 770 + 990 + 210 

= 2894 


Quindi 2894 è un possibile valore di x. Si può ottenere un numero minore 
sottraendo da questa soluzione il prodotto dei quattro divisori: 

2894 —(10 X 3 X 7 X 11) = 2894 — 2310 = 584 
Pertanto 584 è la più piccola soluzione del problema. 


y 3 < 7 
y. < 11 


Il teorema cinese del resto è impiegato nella soluzione del decimo problema di Hilbert. 
In questo caso, il teorema è usato per trovare un numero che diviso per 10, 3, 7 e 11 
dia come resti rispettivamente 4, 2, 3 e 1. La più piccola soluzione è l’intero 584. 


to che possa leggerli ed eseguire ciò 
che vi è scritto. Potrebbe benissimo 
trattarsi di un anziano e saggio signo¬ 
re, ma dovrà essere una persona obbe¬ 
diente che faccia esattamente ciò che 
le si dice. Si fornisce all’ometto un nu¬ 
mero, per esempio 3781; allora egli 
esaminerà attentamente il libretto n. 
3781 e cosi facendo sarà in grado di 
costruire la macchina M 3781. Fatto 
ciò porrà in ingresso nella macchina a 
luce verde M3781 l’intero 3781: se si 
accende la luce verde, il numero 3781 
appartiene a K. Si è cosi ottenuta una 
macchina a luce verde per K. 

_Che cosa possiamo dire riguardo a 
K1 Come possiamo essere sicuri che 
per esso non esista alcuna macchina a 
luce verde? Si supponga allora che vi 
sia una tale macchina. Dal momento 
che K è il complemento di K, si avrà 
allora che comunque si fornisca un in¬ 
gresso a tale macchina, per esempio 
297, essa si accenderà se e solo se 
M 297 non si accende per 297 (se 
M 297 si accendesse, ciò significhereb¬ 
be che _Tintero 297 appartiene a K e. 
non a K). Quindi la macchina per K 
non è certamente M 297 (si veda l’illu¬ 
strazione in basso a pagina 143). Ma 
per la stessa ragione essa non coin¬ 
ciderà con nessuna M n per qualun¬ 
que altro valore di n. Lo stesso argo¬ 
mento si potrà infatti applicare, co¬ 
me è stato fatto per 297, anche per 
ogni altro numero, e ciò dimostra che 
nella biblioteca dei libretti di istruzio¬ 
ni non compare in alcun luogo una 
macchina a luce verde per K. Dal mo¬ 
mento che nel nostro elenco deve es¬ 
sere presente ogni possibile macchina 
a luce verde, ne segue che non può esi¬ 
stere alcuna macchina a luce verde per 
K. Cioè, K non è elencabile. 

Il risultato è certo notevole e meri¬ 
ta di essere meditato e valutato. Sap¬ 
piamo perfettamente che cosa sia l’in¬ 
sieme K; in linea di principio siamo in 
grado di ottenere, mediante la stampa¬ 
trice di un elaboratore, tanti suoi ele¬ 
menti quanti ne vogliamo. Tuttavia, 
non vi potrà mai essere una procedura 
formale (un algoritmo o un program¬ 
ma di macchina) per separare K da K. 
Ecco dunque un esempio di problema 
stabilito con precisione ma che non 
si risolverà mai con mezzi meccanici. 

^he cosa ha a che fare tutto ciò con 
le equazioni diofantee? Si tratta 
semplicemente di questo: Matyasevich 
ha dimostrato che ogni insieme elen¬ 
cabile può essere fatto corrispondere a 
un’equazione diofantea. Più in partico¬ 
lare, se S è un insieme elencabile, vi 
è allora un polinomio P con coefficien¬ 
ti interi e con le variabili x, y u y 2 , ..., 
y„ che corrisponde a tale insieme e che 
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indicheremo con P s ( x, y u y 2 , ..., y„). 
Ogni intero, per esempio 17, appartie¬ 
ne all’insieme S se e solo se l’equazio¬ 
ne diofantea P s (17, y,, y 2 , ..., y n ) = 0 
ammette una soluzione. 

Si potrebbe pensare che per alcuni 
insiemi si debba far ricorso a poli¬ 
nomi molto complicati, ma ciò non av¬ 
viene: non è mai necessario che il gra¬ 
do di P superi 4 né che il numero del¬ 
le variabili y,, y 2 , ..., y„ superi 14. 

Dal risultato di Matyasevich scende 
facilmente la conclusione che non può 
esistere alcuna macchina di Hilbert. Si 
rammenti infatti l’insieme elencabile K 
costruito alcuni capoversi sopra. In ba¬ 
se a quanto dimostrato da Matyase¬ 
vich, vi dovrà essere un’equazione dio¬ 
fantea, P K (x, y b y 2 , ..., y„) = 0, asso¬ 
ciata a tale insieme. Se fosse possibile 
costruire una macchina di Hilbert, cioè 
una macchina a luce verde e rossa per 
saggiare le equazioni diofantee allo 
scopo di determinare se abbiano o me¬ 
no soluzioni, allora per ogni intero x 
potremmo stabilire se esistano o meno 
degli interi y,, y 2 , ..., y„ per cui l’equa¬ 
zione sopra indicata ammetta una so¬ 
luzione. Tuttavia nello stabilire questo 
avremmo anche determinato se x ap¬ 
partiene o meno a K. In altri termini, 
una macchina di Hilbert applicata al¬ 
l’equazione diofantea che descrive K 
potrebbe venir usata come macchina a 
luce verde e rossa per K. D’altra par¬ 
te abbiamo già dimostrato che K non 
è computabile, di modo che non può 
esistere alcuna macchina a luce verde 
e rossa per K. L’unico modo per uscire 
da questo dilemma è quello di conclu¬ 
dere che non esiste alcuna macchina di 
Hilbert. In altre parole, il decimo pro¬ 
blema di Hilbert non è risolubile! 

Il fatto che si possa associare una 
equazione diofantea a ogni insieme 
elencabile è un risultato positivo già di 
per sé di grande interesse, indipenden¬ 
temente dalla sua applicazione al deci¬ 
mo problema di Hilbert. Un insieme di 
interi particolarmente importante e in¬ 
teressante è quello dei numeri primi. 
Un numero è primo se è divisibile solo 
per 1 e per se stesso: come esempi si 
considerino 2, 3, 5, 7, 11, 13 e 17. È 
abbastanza ovvio che tali numeri siano 
elencabili. Un algoritmo per elencarli 
ci è stato tramandato dai greci sotto il 
nome di « crivello di Eratostene ». 
Combinando il risultato di Matyasevich 
con una tecnica ideata da Putnam, si 
può ottenere un’equazione diofantea 
Q Oi, y 2 , y„) = z tale che un nu¬ 

mero positivo z è primo se e solo se 
tale equazione ammette una soluzione 
intera positiva y u y 2 , ..., y n . (La strut¬ 
tura precisa del polinomio Q è trop¬ 
po complicata per essere qui descritta.) 

Un altro notevole risultato può esse¬ 


re ottenuto combinando il teorema di 
Matyasevich con i lavori di Godei sul- 
l’indecidibilità. Comunque si consideri 
un sistema di assiomi di qualunque ge¬ 
nere, dal quale si possano dedurre in¬ 
formazioni riguardo alle equazioni dio¬ 
fantee, si potrà sempre ottenere una 
particolare equazione diofantea con le 
seguenti proprietà: 1) l’equazione non 
ha soluzioni intere positive; 2) il fat¬ 
to che essa non abbia soluzioni intere 
positive non può essere dedotto logica¬ 
mente dall’insieme di assiomi dato. Na¬ 
turalmente, una volta ottenuta l’equa¬ 
zione diofantea, si potrà ottenere un 
nuovo sistema di assiomi in base al 
quale si possa dimostrare che tale 
equazione non ha soluzioni. Ma allora 
questo nuovo insieme di assiomi darà 
origine a una nuova equazione diofan¬ 
tea per cui valgono le proprietà asserite. 

Cu che cosa si basa la dimostrazio¬ 
ne del teorema di Matyasevich? Ol¬ 
tre ai risultati già menzionati della teo¬ 
ria classica dei numeri, ciò che ha un 
ruolo essenziale è l’asserto noto sotto il 
nome di teorema cinese del resto. È 
utile illustrare tale teorema con un 
esempio numerico. 

Si supponga di voler trovare un nu¬ 
mero che diviso per 10, 3, 7 e 11 abbia 
come resti rispettivamente 4, 2, 3 e 1 (si 
veda l’illustrazione in basso della pagina 
a fronte). Il teorema cinese del re¬ 
sto garantisce 1’esistenza di un nume¬ 
ro siffatto (in questo caso, per esem¬ 
pio, 584 è un numero di tal gene¬ 
re). Tutto quello che è richiesto af¬ 
finché si possa applicare il teorema ci¬ 
nese del resto è che nessuna coppia 
dei divisori utilizzati abbia fattori co¬ 
muni (eccettuata ovviamente l’unità). 
Vi può essere un qualunque numero 
di divisori e i resti richiesti possono 
essere interi positivi qualsivoglia. 

Nel 1931 Godei mostrò che si pote¬ 
va far uso del teorema cinese del re¬ 
sto come metodo di codificazione, cioè 
per codificare con un solo numero qua¬ 
lunque sequenza finita di numeri. A 
partire dal numero di codice si può 
riottenere la sequenza nello stesso mo¬ 
do in cui nell’esempio dato si possono 
ottenere 4, 2, 3 e 1 a partire da 584, 
cioè come resti di divisioni successive. 
I divisori possono essere scelti in pro¬ 
gressione aritmetica. 

Il primo tentativo di dimostrazione 
dell’impossibilità di esistenza di una 
macchina di Hilbert, venne compiuta 
da uno di noi (Davis) nella sua tesi di 
dottorato nel 1950. La tecnica di Godei 
basata sull’uso del teorema cinese del 
resto come metodo di codificazione 
venne applicata per associare a ogni 
elencabile S un’equazione diofantea 
P s ( k , x, z, Vi, y 2 , y„) = 0. Sfortu- 


1. 

u + 

w - 

v - 2 = 0 


II. 

; - 

2v - 

2a - 1 = 0 


III. 

/ 2 - 

Iz - 

z 2 - 1=0 


IV. 

9 - 

bl 2 

= 0 


V. 

9 2 

- gh 

O 

II 

1 

-c 

1 


VI. 

m 

- c(2b + g) - 3 = 

0 

VII. 

m 

- fi - 

2 = 0 


Vili. 

X 2 

- mxy + y 2 - 1 = 

0 

IX. 

(d 

- 1) 

+ u - x -1 

= 0 

X. 

x - 

v - 

(2P + g) (e - 

1) = 0 


La soluzione di Matyasevich del decimo 
problema di Hilbert si basa su un’equazio¬ 
ne diofantea ottenuta elevando al quadra¬ 
to ognuna di queste dieci equazioni, som¬ 
mandole insieme ed eguagliando a zero il 
polinomio complicato che ne risulta. In 
queste equazioni i valori u e v sono col¬ 
legati nelle soluzioni in modo tale che v 
è il 2u-esimo numero di Fibonacci. Da ta¬ 
le soluzione segue che per ogni insieme 
elencabile esiste un’equazione diofantea a 
esso associata. Dal momento che esistono 
insiemi elencabili i cui complementi non 

10 sono, si avrà che non tutti gli insiemi 
elencabili possono avere una macchina a 
luce verde e rossa. Poiché avere una mac¬ 
china di Hilbert per le equazioni diofantee 
equivale ad avere una macchina a luce 
verde e rossa per ogni insieme elencabile, 

11 risultato di Matyasevich dimostra che 
non si può costruire alcuna macchina di 
Hilbert per saggiare le equazioni diofantee. 


natamente la relazione che sussisteva 
fra un insieme e l’equazione a esso col¬ 
legata risultava essere piu complicata 
di quanto fosse richiesto dal decimo 
problema di Hilbert. Più precisamente 
la relazione era: un intero positivo x 
appartiene all’insieme S se e solo se per 
qualche valore intero positivo di z è 
possibile trovare una soluzione per cia¬ 
scuna delle equazioni diofantee ottenu¬ 
te a partire da P s ( k , x, z, yp y 2 , 
y n ) = 0 ponendo k — 1, poi k = 2 e co¬ 
si via fino a z . Anche se tale risultato 
sembrava vicino in modo assai promet¬ 
tente a ciò che era necessario, esso era 
solo un punto di partenza. 

Circa nello stesso periodo lulia Ro¬ 
binson diede inizio alle sue ricerche su¬ 
gli insiemi che potessero venir defini¬ 
ti per mezzo di equazioni diofantee e 
sviluppò molte tecniche ingegnose per 
trattare equazioni le cui soluzioni si 
comportassero in modo esponenziale 
(crescessero cioè come una potenza). 
Nel 1960 la Robinson, Davis e Putnam 
dimostrarono insieme un altro risulta¬ 
to. Utilizzarono cioè sia le ricerche del¬ 
la Robinson sia il risultato di Davis per 
dimostrare che a ogni insieme elenca¬ 
bile poteva corrispondere un’equazione 
diofantea in senso lato, cioè nel senso 
che si ammetteva che le variabili del- 
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l’equazione comparissero anche come 
esponenti (un esempio di un’equazione 
di questo tipo può essere 2‘ + x 2 = z 3 ). 
Davis, Robinson e Putnam, combinan¬ 
do le loro ricerche con alcuni risultati 
precedenti della Robinson, giunsero al¬ 
la seguente conclusione: se fosse stato 
possibile trovare anche una sola equa¬ 
zione diofantea le cui soluzioni si com¬ 
portassero in modo esponenziale in un 
senso ben precisato, si sarebbe potuto 
descrivere ogni insieme elencabile con 
un’equazione diofantea. Ciò a sua vol¬ 
ta avrebbe dimostrato la insolubilità 
del decimo problema di Hilbert. 

Qccorsero dieci anni per trovare una 
equazione diofantea le cui soluzio¬ 
ni crescessero esponenzialmente nel 
modo precisato. Nel 1970 Matyasevich 
riuscì a trovare un’equazione di que¬ 
sto tipo facendo uso di quelli che sono 
noti come i numeri di Fibonacci. Que¬ 


sti famosi numeri vennero scoperti nel 
1202 da Leonardo Pisano, detto anche 
il Fibonacci. Egli li scopri calcolando 
il numero totale delle coppie di discen¬ 
denti di una coppia di conigli sotto la 
ipotesi che la coppia originaria e ogni 
successiva coppia di figli si riproduces¬ 
se una volta al mese (a partire dal se-i 
condo mese di vita). La serie di Fibo¬ 
nacci si ottiene iniziando con 1, quin¬ 
di ancora 1 e successivamente som¬ 
mando i due numeri precedenti per ot¬ 
tenere il successivo: il primo numero 
di Fibonacci è 1, il secondo è 1, il ter¬ 
zo è 1 + 1 = 2, il quarto è 1+2 = 3, 
il quinto è 2 + 3 = 5 e cosi via. La 
proprietà importante ai fini del decimo 
problema di Hilbert è il fatto che i 
numeri di Fibonacci crescono in mo¬ 
do esponenziale, ossia l’n-esimo nume¬ 
ro di Fibonacci è approssimativàmente 
proporzionale all’n-esima potenza di 
un certo numero reale fissato. 


Se si fosse trovata un’equazione le cui 
soluzioni mettessero in relazione n con 
l’n-esimo numero di Fibonacci, essa sa¬ 
rebbe stata l’esempio cercato di equazio¬ 
ne diofantea le cui soluzioni si comporta¬ 
no in modo esponenziale. Da tale esem¬ 
pio sarebbe scesa allora la solu¬ 
zione del decimo problema di Hilbert. 
Ciò che Matyasevich fece fu proprio 
costruire un’equazione diofantea di 
questo tipo (si veda l’illustrazione a 
pagina 145). Dimostrando che l’in¬ 
sieme dei numeri di Fibonacci risulta¬ 
va in tal modo associato a un’equazio¬ 
ne diofantea, si ricavava immediatamen¬ 
te dal teorema di Davis, Robinson e 
Putnam che per ogni insieme elenca¬ 
bile esisteva un’equazione a esso asso¬ 
ciata, e ciò in particolare anche per 
l’insieme K che non è computabile. E 
in questo modo si conclude la ricerca 
della soluzione del decimo problema 
di Hilbert. 
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Gli algoritmi 

Un algoritmo è un insieme di regole in grado di fornire una specifica 
uscita come risposta a una specifica entrata. Ogni passo va definito 
con precisione per essere tradotto in un linguaggio per calcolatori 


di Donald E. Knuth 


F ino a dieci anni fa la parola «algo¬ 
ritmo» era sconosciuta alla mag¬ 
gior parte delle persone colte, e, in 
verità, era scarsamente necessaria. Lo 
sviluppo rapidissimo della scienza dei cal¬ 
colatori, il cui punto focale è costituito 
dallo studio degli algoritmi, ha modifi¬ 
cato la situazione: attualmente la parola 
è indispensabile. Esistono svariati altri 
termini che esprimono, almeno in parte, 
il concetto in questione: procedura, pre¬ 
scrizione, processo, routine, metodo. Al 
pari di queste cose un algoritmo è un in¬ 
sieme di regole o direttive atte a fornire 
una risposta specifica a una specifica 
entrata. Caratteristica distintiva degli al¬ 
goritmi è la totale eliminazione delle am¬ 
biguità: le regole devono essere sufficien¬ 
temente semplici e ben definite da poter 
essere eseguite da una macchina. Un’al¬ 
tra caratteristica fondamentale degli al¬ 
goritmi è che devono sempre avere ter¬ 
mine dopo un numero finito di passi. 

Un programma è l’esposizione di un 
algoritmo in un linguaggio accuratamen¬ 
te definito. Quindi, il programma di un 
calcolatore rappresenta un algoritmo, per 
quanto l’algoritmo stesso sia un costrut¬ 
to intellettuale che esiste indipendente¬ 
mente da qualsiasi rappresentazione. Al¬ 
lo stesso modo, il concetto di numero 
due esiste nella nostra mente anche quan¬ 
do non sia espresso graficamente. Chiun¬ 
que abbia steso un programma di calcolo 
è in grado di rendersi conto del fatto che 
un algoritmo debba essere esattamente 
definito, con un’attenzione ai particolari 
inusitata in altre attività. 

Programmi per problemi numerici so¬ 
no stati compilati fino dal 1800 a.C., 


quando i matematici babilonesi del tem¬ 
po di Hammurabi stabilirono delle rego¬ 
le di risoluzione per alcuni tipi di equa¬ 
zioni. Le regole erano determinate come 
procedure passo-passo, applicate siste¬ 
maticamente a esempi numerici partico¬ 
lari. La stessa parola «algoritmo» ha 
origine nel medio oriente, sebbene molto 
tempo dopo. Essa proviene dall’ultima 
parte del nome dello studioso persiano 
Abu Ja’far Mohammed ibn Musa al- 
-Khowàrizmi, il cui testo di aritmetica 
(825 d.C. circa) esercitò una significativa 
influenza per molti secoli. 

Tradizionalmente gli algoritmi erano 
applicati unicamente a problemi numeri¬ 
ci; l’esperienza con i calcolatori ha tutta¬ 
via mostrato che i dati elaborati dai pro¬ 
grammi possono virtualmente rappresen¬ 
tare qualsiasi cosa. Di conseguenza, l’at¬ 
tenzione della scienza dei calcolatori si è 
trasferita allo studio delle diverse strut¬ 
ture con cui si possono rappresentare le 
informazioni e all’aspetto ramificato o 
decisionale degli algoritmi, che permette 
di seguire differenti sequenze di opera¬ 
zioni in dipendenza dallo stato delle cose 
in un determinato istante. È questa la 
caratteristica che talvolta rende preferi¬ 
bili, per la rappresentazione e l’organiz¬ 
zazione delle informazioni, i modelli al¬ 
goritmici a quelli matematici tradiziona¬ 
li. Per quanto gli algoritmi numerici pos¬ 
siedano molte interessanti caratteristiche, 
nella discussione che segue mi limiterò a 
esempi non-numerici, proprio per sotto- 
lineare il fatto che gli algoritmi si occu¬ 
pano innanzitutto della manipolazione di 
simboli, che non rappresentano necessa¬ 
riamente numeri. 


La ricerca nella memoria 
eli un calcolatore 

Per illustrare come gli algoritmi possa- 
ni venire studiati con profitto, prenderò 
in considerazione in modo abbastanza 
approfondito un semplice problema di 
ritrovamento di un’informazione. Il pro¬ 
blema consiste nel determinare se una 
certa parola x appaia o meno nella me¬ 
moria di un calcolatore. La parola x può 
essere il nome di una persona, il numero 
di un componente meccanico, un termi¬ 
ne in qualche lingua straniera, un com¬ 
posto chimico, il numero di una carta di 
credito o qualsiasi altra cosa. Il proble¬ 
ma è interessante solo quando l’insieme 
di tutte le possibili x è troppo grande 
perché il calcolatore possa esaminarlo 
all’istante; altrimenti sarebbe sufficiente 
predisporre una posizione in memoria 
per ogni parola. 

Supponiamo che n differenti parole 
siano state immagazzinate nella memoria 
dell’elaboratore. Dobbiamo costruire un 
algoritmo che accetti in entrata la parola 
a: e ci fornisca in uscita la posizione j in 
cui appare x. Quindi, se x è presente, 
otterremo come uscita un numero com¬ 
preso tra 1 e n; qualora invece x non si 
trovi nella memoria, avremo 0 in uscita, 
per indicare l’insuccesso della ricerca. 

Naturalmente la risoluzione di questo 
problema non presenta alcuna difficoltà. 
L’algoritmo più semplice consiste nel col¬ 
locare le parole nelle posizioni da 1 a n 
ed esaminare a turno ogni parola. Se x si 
trova nella posizione j, il calcolatore de¬ 
ve fornire in uscita j per poi fermarsi; 
ma se vengono esaurite tutte le n possibi- 
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lità senza alcun esito, si deve fermare 
con 0 in uscita. Questa descrizione della 
strategia di ricerca sarebbe probabilmen¬ 
te troppo imprecisa per un elaboratore, 
ma può venire determinata in modo più 
accurato. La possiamo infatti scrivere 
come una sequenza di passi nel modo 
seguente: 

Algoritmo A; ricerca sequenziale. 

Al. [Inizio] Poni j*-n (La freccia sta a 
indicare che il valore della variabile y è 
posto uguale a n, il numero delle parole 
della tabella da esaminare. Questo è il 
valore iniziale di j. I passi successivi 
dell’algoritmo faranno assumere a y la 
sequenza di valori n, n —1, n —2, fino a 
0 o a una posizione contenente la parola 
in entrata x.) 


A2. [Esito negativo?] Se y' = 0, j in 
uscita e l’algoritmo si arresta. (Altrimen¬ 
ti vai al passo A3.) 

A3. [Esito positivo?] Se x = KEY[/], j 
in uscita e l’algoritmo si arresta. (Il ter¬ 
mine KEY[/] indica la parola collocata 
nella posizione y.) 

A4. [Iterazione] Poniy'=y—1 (diminui¬ 
sci di 1 il valore di y) e torna al passo A2. 

Possiamo visualizzare la successione 
dei passi rappresentando l’algoritmo con 
uno schema a blocchi (si veda l’illustra¬ 
zione nella pagina a fronte). Una delle ra¬ 
gioni per cui è importante specificare con 
la massima accuratezza i passi, è che l’al¬ 
goritmo deve funzionare in ogni caso. La 
descrizione informale fatta più sopra po¬ 
trebbe suggerire un algoritmo erroneo 


che porti direttamente dal passo Al al 
passo A3; un simile algoritmo sarebbe 
inadeguato per n = 0 (quando non ci sia 
alcuna parola in memoria), poiché il pas¬ 
so Al porrebbe y' = 0 e A3 ci farebbe 
considerare l’inesistente KEY[0]. 

È interessante notare la possibilità di 
perfezionare l’algoritmo A assegnando 
un significato alla notazione KEY[0], 
permettendo cioè che venga collocata una 
parola in «posizione 0», così come nelle 
posizioni da 1 a n. Se il passo Al pones¬ 
se KEY[0]- f -x come j*~n, si potrebbe e- 
Iiminare il passo A2, rendendo la ricerca 
più veloce del 20 per cento circa su molti 
calcolatori. 

Sfortunatamente per i programmatori, 
i linguaggi dei calcolatori maggiormente 
usati (il COBOL e il FORTRAN stan- 








L’algoritmo a ricerca sequenziale (algoritmo A nel testo) ricerca una 
parola in entrata in una tabella i cui ingressi non siano disposti in 
alcun ordine particolare. Questa tabella è dotata di 25 ingressi, o 
chiavi: KEY[1], KEY[2], fino a KEY[25]. Ogni chiave è un nome di 
persona. Supponiamo che la parola in entrata sia il nome «Grant». 


L’algoritmo A ricerca «Grant» confrontandolo dapprima con 
KEY[25], che è «Wilson», quindi con KEY[24], che è «Taft», ecc. 
Qui «Grant» è KEY[17], e quindi l’algoritmo ci fornisce «17» (in 
alto). Se in entrata ci fosse stato «Gibbs», l’algoritmo avrebbe confron¬ 
tato «Gibbs» con tutte le chiavi ottenendo 0 in uscita (in basso). 


148 




















START 


dard) non prevedono che lo 0 sia impie¬ 
gato come indice per posizioni di memo¬ 
ria; quindi l’algoritmo espresso in uno di 
questi linguaggi, non può venire perfe¬ 
zionato tanto facilmente. 

L’algoritmo A risolve certamente il 
problema della ricerca in una tabella di 
parole, ma la soluzione non è certo otti¬ 
male, a meno che il numero delle parole 
non sia decisamente esiguo, diciamo 25 o 
meno. Se n fosse pari a un milione, una 
semplice ricerca sequenziale costituireb¬ 
be una tecnica di consultazione insop¬ 
portabilmente lenta. Difficilmente ci si 
sobbarcherebbe il costo della preparazio¬ 
ne di una simile tabella, se non ci si a- 
spettasse di consultarla frequentemente, e 
non si vorrebbe sprecare molto tempo 
per la ricerca. L’algoritmo A equivale 
alla ricerca di un numero telefonico fatta 
consultando un elenco degli abbonati pa¬ 
gina per pagina, colonna per colonna, 
una riga alla volta. Si può certamente 
fare di meglio. 

L ’utilità di un ordinamento 

Può essere istruttivo considerare un 
elenco telefonico come esempio di una 
simile tabella di informazioni. Di fronte 
alla richiesta di trovare il numero di tele¬ 
fono di qualcuno che abiti al 1642 East 
della 56 a Strada, non ci sarebbe in effetti 
alternativa migliore alla ricerca sequen¬ 
ziale equivalente all’algoritmo A, dato 
che un normale elenco degli abbonati 
non è predisposto per la ricerca basata 
sull’indirizzo. D’altronde, quando si cer¬ 
ca un nome, è possibile trarre vantaggio 
dall’ordinamento alfabetico. Tale ordi¬ 
namento comporta un vantaggio sostan¬ 
ziale poiché in ogni punto dell’elenco è 
sufficiente un semplice sguardo per eli¬ 
minare da ogni ulteriore considerazione 
una grande quantità di nomi. 

Se le parole di una tabella sono siste¬ 
mate in un qualche ordine coerente, esi¬ 
stono svariati modi per determinare una 
efficiente procedura di ricerca. Quella 
più semplice inizia dall’esame dell’ingres¬ 
so centrale della tabella. Se la parola 
cercata precede, alfabeticamente o nu¬ 
mericamente, l’ingresso centrale, l’intera 
seconda metà della tabella può venire 
eliminata; analogamente, se x segue l’in¬ 
gresso centrale, si potrà eliminare l’inte¬ 
ra prima metà. Un unico confronto ci 
porta quindi a un problema di ricerca di 
dimensioni dimezzate rispetto a quello di 
partenza. Lo stesso procedimento può 
essere applicato anche alla parte restante 
della tabella, e così via fino a che la pa¬ 
rola x non sia individuata. Questa proce¬ 
dura è nota come ricerca binaria. 

Sebbene l’idea sottostante alla ricerca 
binaria sia semplice, è necessaria una 
certa attenzione per stenderne l’algorit¬ 
mo. Tanto per cominciare, in una lista 
con un numero pari di elementi non 
esiste un unico ingresso centrale e, inol¬ 
tre, non è immediatamente chiaro quan¬ 
do ci si debba fermare in caso di insuc¬ 
cesso. Gli insegnanti di scienza dei calco¬ 
latori hanno infatti notato che T80 per 
cento circa degli studenti cui sia stato 



Il diagramma a blocchi per l’algoritmo A illustra il percorso logico seguito dalla ricerca sequen¬ 
ziale per individuare una parola x in una tabella di n chiavi. L’algoritmo cerca x confrontandolo 
dapprima con KEY[n], quindi con KEY[n—1], con KEY[n—2], ecc. Se x uguaglia KEY[/], l’al¬ 
goritmo emette j, la posizione in cui si trovava x. Se x non si trova nella tabella, l’algoritmo 
fornisce in uscita 0. La freccia al passo Al (/■*-«) significa «Poni j uguale a n» in quel passo. I 
vari passi sono illustrati nel testo. Per trovare x, l’algoritmo A esamina in media metà tabella. 
Nel caso peggiore, se cioè x è KEY[1] o non è presente, l’algoritmo A esamina l’intera tabella. 


richiesto per la prima volta di compilare 
un programma di ricerca binaria fornisce 
un risultato inesatto, anche quando ab¬ 
bia avuto più di un anno di esperienza di 
programmazione! Il lettore che ritenga di 
dominare sufficientemente bene gli algo¬ 
ritmi, ma non abbia mai compilato un 
programma per la ricerca binaria, può 
divertirsi a cercare di stenderne uno pri¬ 
ma di leggere la soluzione riportata sotto. 

Algoritmo B; ricerca binaria. La nota¬ 
zione è la stessa delTalgoritmo A; inol¬ 
tre, si assume che nella relazione < la pri¬ 
ma parola, KEY[1], preceda la seconda, 
KEY[2], e questa la terza, e cosi fino 
all’ultima, KEY[n]. La condizione può 
essere espressa così: KEY[1]<KEY[2]< 
<KE Y[3]<... <KEY [n], 

Bl. [Inizio] Poni /•*-0, r*~n + 1 (La let¬ 
tera / indica il limite sinistro della ricer¬ 
ca, r quello destro. Più precisamente, 
KEY[y] non può essere il riscontro della 
parola data x, a meno che la posizione j 
non sia contemporaneamente maggiore 
di / e minore di r.) 

B2. [Ricerca del punto centrale] Poni 

j*-L(l + r)/2J (le parentesi I-1 stanno 

per «Arrotonda per difetto all’intero più 
vicino». Cioè, se (/ + r) è pari, j è uguale 
a (/ + /■)/2; se (l + r) è dispari, j è uguale a 
(/ + r —1)/2.) 


B3. [Esito negativo?] Se j=l, 0 in 
uscita e l’algoritmo si arresta. (Se j ugua¬ 
glia l, allora r deve essere pari a l + 1, 
poiché r è comunque maggiore di /; ne 
segue che x non corrisponde ad alcuna 
chiave della tabella.) 

B4. [Confronto.] (A questo punto j>l 
e j<r) Sex = KEY[/'], j in uscita e l’algo¬ 
ritmo si arresta. Se x<KEY[/], poni r*-j 
e ritorna a B2. Se x>KEY[/'], poni l*-j e 
torna a B2. 

L’illustrazione della pagina seguente 
mostra una rappresentazione, passo per 
passo, della ricerca operata dall’algorit¬ 
mo B in una lista di 25 parole. 

Appare evidente che la ricerca binaria 
(algoritmo B) è decisamente migliore di 
quella sequenziale (algoritmo A), ma è 
possibile un ulteriore perfezionamento? 
E quando l’algoritmo sarà ottimale? Per 
rispondere a queste domande si impone 
un’analisi di tipo quantitativo. 

Analisi quantitativa 

Analizziamo, per prima cosa, i casi 
peggiori degli algoritmi A e B. Quanto 
tempo impiega ogni algoritmo a trovare 
la parola x in un elenco di lunghezza ni 
Per l’algoritmo A la risposta è semplice: 
se x è uguale a KEY[1], o addirittura 
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non è presente nella lista, occorreranno 
n applicazioni del passo A3; vale a dire, 
la parola in questione deve essere con¬ 
frontata con tutti gli n ingressi della 
tabella, prima che la ricerca si concluda. 
Inoltre, l’algoritmo non eseguirà il passo 
A3 più di n volte. Se la ricerca sequen¬ 
ziale viene applicata a una tabella con un 
milione di ingressi, verranno eseguiti, nel 
caso peggiore, un milione di confronti. 

La risposta è di poco più complessa 
nel caso della ricerca binaria. Poiché l’al¬ 
goritmo B scarta metà della tabella rima¬ 
nente, dopo ogni esecuzione del passo 
B4, all’inizio opera con l’intera lista, 
quindi con metà, un quarto, un ottavo, e 
via dicendo. Il numero massimo di ap¬ 
plicazioni del passo B4 sarà quindi k, 
dove A: è il più piccolo intero tale che 2 
sia maggiore di n. Così, qualora la ricer¬ 
ca binaria sia applicata a una tabella con 
un milione di ingressi (IO 6 ), k sarà ugua¬ 
le a 20. Infatti 2 20 è maggiore di IO 6 , ma 
IO 6 è maggiore di 2 19 . Consultando una 
tabella con IO 6 ingressi, dovremo opera¬ 
re al più 20 confronti. 

Prendendo le mosse dal risultato otte¬ 
nuto per il caso peggiore, si può arrivare 


ad affermare che l’algoritmo B non solo 
costituisce un buon metodo di ricerca, 
ma che, anzi, è il migliore di tutti i possi¬ 
bili algoritmi che procedano unicamente 
comparando x alle chiavi della tabella. 
La ragione è che è un siffatto algoritmo 
non potrà esaminare più di 2*-l diffe¬ 
renti chiavi nei primi k confronti. Indi¬ 
pendentemente dalla strategia adottata, 
il primo confronto avverrà sempre con 
una particolare chiave della tabella, e il 
secondo avrà a che fare con al massimo 
altre due (a seconda che x sia minore o 
maggiore della prima chiave), il terzo 
confronto al massimo con altre 4 chiavi, 
il quarto con otto, e via di questo passo. 
Se quindi un algoritmo di ricerca per 
confronti non opera più di k confronti, 
la tabella non potrà contenere più di 
1+2 + 4 + 8 + ...+2*' 1 chiavi distinte, e il 
valore di questa somma è appunto 2*-l. 

Il popolare «Gioco delle venti doman¬ 
de» può essere utilizzato allo stesso mo¬ 
do. In questo passatempo un giocatore 
pensa a un oggetto di cui scrive, non 
visto, il nome su un foglietto. Gli altri 
giocatori devono scoprire di che oggetto 
si tratti, ponendo 20 domande che am¬ 


mettano come risposta unicamente un sì 
o un no. All’inizio del gioco viene detto 
se l’oggetto misterioso sia un animale, 
un vegetale, un minerale, o una combi¬ 
nazione di simili attributi, che si suppon¬ 
gono ben definiti. Sulla falsariga di quan¬ 
to fatto nel precedente paragrafo, si può 
dimostrare che gli avversari del primo 
giocatore non possono identificare cor¬ 
rettamente più di 2 23 oggetti differenti, 
quale che sia l’ingegnosità delle doman¬ 
de. Ci sono solo 2 3 (otto) possibili sotto¬ 
insiemi di attributi animali, vegetali e 
minerali, e ci sono solo 2 20 possibili ri¬ 
sposte ai venti quesiti. Il numero totale 
di oggetti eventualmente identificabili sa¬ 
rà allora 2 23 . L’argomentazione resta va¬ 
lida anche quando le domande siano in 
relazione alle risposte ottenute preceden¬ 
temente. 

In altri termini, per identificare più di 
2 23 oggetti distinti, 20 domande non so¬ 
no sufficienti. Il problema della ricerca è 
molto simile, per quanto non identico, 
dato che l’algoritmo non si limita a que¬ 
siti del tipo «sì-no». Le domande poste 
da algoritmi del tipo considerato ammet¬ 
tono tre possibili risultati: x<KEY[/], 


ENTRATA : | X = GRANTl 

1 = 0 j = 13 r = 26 



L’algoritmo a ricerca binaria (algoritmo B nel testo), costituisce un 
sostanziale miglioramento rispetto alla ricerca sequenziale, quando la 
tabella da esaminare sia grande. Gli ingressi della tabella devono 
venire preventivamente ordinati. Qui i 25 nomi sono elencati in ordine 
alfabetico. La parola cercata x sia ancora «Grant». L’algoritmo con¬ 
fronta «Grant» dapprima con la chiave che si trova nella posizione 
centrale, j, della tabella. II valore iniziale di j è ottenuto ponendo il 
limite sinistro / della ricerca pari a 0, e quello destro r pari a n +1: in 
questo caso r è 26. / e r vanno sommati, dividendo quindi per 2 e 
arrotondando per difetto all’intero più vicino, qualora il risultato non 
sia un intero. Il punto centrale j della tabella è 26/2, cioè 13, che è la 
posizione di «Lincoln» (in alto). Poiché «Grant» precede alfabetica¬ 


mente «Lincoln», l’algoritmo scarta la metà di destra della tabella, 
contenente solo nomi alfabeticamente precedenti, o al più coincidenti 
con «Lincoln». Per la metà rimanente l’algoritmo calcola un nuovo 
punto centrale, ponendo r uguale alla posizione j appena esaminata, 
che è 13 ( seconda riga dall’alto). II nuovo punto medio j è (0 +13)/2, 
arrotondato per difetto a 6, la posizione di «Garfield». «Grant» segue 
«Garfield», sicché viene scartato il quarto di tabella di sinistra, 
ponendo il limite sinistro 1=6 ( seconda riga dal basso). Ripetendo la 
procedura, si trova «Grant» in posizione 7 (in basso). Se x fosse stato 
«Gibbs», l’algoritmo B avrebbe eseguito ancora un passo, con 1=6 
e r posto uguale a 7. La coincidenza del punto centrale j=6 con il 
limite sinistro avrebbe indicato che «Gibbs» non è in tabella. 
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Il diagramma a blocchi per l’algoritmo B illustra le regole preposte alla ricerca binaria. 
L’algoritmo ricerca la parola in entrata x in una tabella di n chiavi precedentemente ordinata. La 
x viene confrontata con l’ingresso centrale della tabella. Se a: è maggiore (» dell'ingresso centrale, 
viene confrontato con il punto di mezzo della metà di destra della tabella. Se invece x è minore 
(<) del punto centrale, viene confrontata con il punto di mezzo della metà di sinistra. Il 
processo continua, scartando ogni volta la metà delia tabella rimanente, finché non si rinvenga 
x oppure se ne constati l’assenza della tabella. I simboli (I—I) hanno il significato «arroton¬ 
da per difetto all’intero più vicino». L’algoritmo B viene dettagliatamente analizzato a pagina 149. 


x=KEY[/] oppure x>KEY[/]. Se una ta¬ 
bella è dotata di 2 k o più ingressi, il 
precedente ragionamento mostra che k 
confronti di x con le chiavi della tabella 
non sono sempre sufficienti. Ogni algo¬ 
ritmo che compie una ricerca in una lista 
di un milione di parole operando solo 
confronti, dovrà in alcuni casi esaminare 
20 o più di queste parole. In breve, nel 
peggiore dei casi la ricerca binaria dà il 
risultato migliore. 

L’analisi del comportamento degli al¬ 
goritmi nel caso più sfavorevole non può 
però esaurire la nostra indagine: sarebbe 
eccessivamente pessimistico prendere del¬ 
le decisioni basandosi unicamente sulla 
conoscenza di quanto di peggio possa 
accadere. Una più approfondita com¬ 
prensione dei rispettivi meriti degli algo¬ 
ritmi A e B può essere raggiunta analiz¬ 
zandone il comportamento in un caso in¬ 
termedio. Se ognuna delle n chiavi di 
una tabella ha le stesse probabilità di 
essere esaminata, qual è il numero di 
confronti che si renderà necessario? Nel 
caso della ricerca sequenziale (algoritmo 
A), la risposta è data dalla media 
(1 +2 + 3 + ... + n)/n, che è uguale a 
(« + l)/2. In altre parole, per trovare x 
dovremmo consultare in media metà del¬ 
la tabella. Per determinare il numero 
medio di confronti necessari per trovare 
x con l’aiuto dell’algoritmo B (ricerca bi¬ 
naria) il calcolo è di poco più complica¬ 
to. La risposta è infatti k —[(2 — k —1 )/n] 
dove k è il numero di confronti richiesto 
nel caso più sfavorevole. Per valori di ri 
molto elevati il risultato è approssimati¬ 
vamente uguale a k —1; nel caso medio, 
dunque, l’algoritmo B necessita di un 
solo confronto in meno rispetto al caso 
maggiormente sfavorevole. Estendendo 
debitamente l’argomentazione, si può di¬ 
mostrare che la ricerca binaria costitui¬ 
sce il migliore degli algoritmi possibili, 
anche dal punto di vista del caso medio: 
ogni algoritmo di ricerca deve operare in 
media almeno k —[(2*— k —1 )/n] con¬ 
fronti, e ancor più nel caso peggiore. 

Al di là del meglio 

Non appena una cosa viene dimostra¬ 
ta impossibile a compiersi, una quantità 
di gente si mette al lavoro per cercare di 
realizzarla comunque. Questa sembra 
una componente essenziale del compor¬ 
tamento umano. Ho appena finito di 
mostrare che la ricerca binaria costituisce 
la condotta ottimale per compiere ricer¬ 
che nella memoria di un calcolatore, ed 
ecco che cerco un metodo migliore. In 
primo luogo, quando il numero delle 
parole è esiguo, l’algoritmo A si rivela in 
pratica migliore dell’algoritmo B. Ma ciò 
non sarebbe in contraddizione con la 
dimostrazione precedente? La ragione sta 
nell’avere paragonato gli algoritmi A e B 
unicamente in base al numero di con¬ 
fronti operati. Di fatto l’algoritmo A ri¬ 
chiede una minore attività di calcolo, co¬ 
sicché una macchina impiegherà un tem¬ 
po minore per eseguire ogni confronto. 
Con un normale calcolatore saranno ne¬ 
cessarie in media 2n+6 unità di tempo, 


circa, per una lista di lunghezza n. L’al¬ 
goritmo B, d’altra parte, richiederà, sot¬ 
to le stesse condizioni, 121og 2 rc —11 + 12 
( k+\)/n unità di tempo, circa. Se non 
sono da sondare più di 20 chiavi l’algo¬ 
ritmo A sarà allora preferibile all’algo¬ 
ritmo B. Questo numero può variare leg¬ 
germente da calcolatore a calcolatore, 
ma ciò basta a mostrare che l’efficienza 
di un algoritmo non può essere determi¬ 
nata semplicemente dal numero di con¬ 
fronti. 

C’è ancora un’altra ragione per cui 
l’algoritmo B può venire migliorato. 
Quando consultiamo un elenco telefoni¬ 
co, cercando un nome x, e lo confrontia¬ 
mo con quelli di una pagina, il nostro 
comportamento successivo non sarà in¬ 
fluenzato solo dal fatto che il nome cer¬ 
cato sia alfabeticamente precedente o se¬ 
guente a quelli della pagina, ma dipende¬ 
rà anche da quanto questa sia precedente 
o seguente, in modo da saltare molte 
pagine nel caso pensassimo di esserne 
molto distanti. La dimostrazione prece¬ 
dente dell’ottimalità della ricerca binaria 
non si applica ad algoritmi che facciano 
uso di procedimenti quali il grado di 
diversità sussistente tra x e una partico¬ 
lare chiave. Nel caso delle venti doman¬ 


de vale un discorso analogo: i giocatori 
potrebbero notare la lunghezza della pa¬ 
rola segreta, mentre questa viene scrìtta, 
oppure potrebbero ricavare delle infor¬ 
mazioni dal tempo impiegato dall’avver¬ 
sario per rispondere «sì» o «no». 

Chi sia interessato all’efficienza, non 
necessariamente consulterà un elenco te¬ 
lefonico partendo da metà, come fareb¬ 
be un calcolatore: il metodo di interpo¬ 
lazione, con l’aiuto dell’ordinamento al¬ 
fabetico, da tempo di uso comune, dà 
migliori risultati, a dispetto delle dimo¬ 
strazione per cui la ricerca binaria sareb¬ 
be la migliore. Andrew C. Yao del MIT 
e F. Frances Yao della Brown University 
hanno recentemente dimostrato che il nu¬ 
mero medio delle unità di tempo neces¬ 
sarie a un algoritmo di ricerca con inter¬ 
polazione per accedere alla tabella è log 2 
log 2 n, a cui va sommata al massimo una 
piccola costante, a patto che gli ingressi 
della tabella siano numeri casuali indi- 
pendenti e uniformemente distribuiti. 
Per n molto grande, log 2 log 2 /j è deci¬ 
samente minore di log 2 «, per cui una 
ricerca con interpolazione risulterà mol¬ 
to più rapida di quella binaria. L’idea 
sottostante alla dimostrazione di Yao è 
che ogni iterazione di una ricerca con 
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DUE RISPOSTE 


Il gioco delle venti domande è un passatempo nel quale un giocatore 
pensa a un oggetto, che descrive come animale, vegetale o minerale, o 
come una combinazione di questi attributi. Gli avversari devono 
cercare di indovinare di che oggetto si tratti, ponendo venti domande 


alle quali si risponde con un «sì» o con un «no». Si dimostra che i 
giocatori non possono identificare correttamente più di 2 23 oggetti, 
cioè 8 388 608. Ciò perché l’insieme costituito dai 3 attributi animale, 
vegetale e minerale, ha solo otto, 2 3 , possibili sottoinsiemi, (compren- 


interpolazione tenda a ridurre l’incertez¬ 
za della posizione di x da n alla radice 
quadrata di n. Resta così dimostrato che 
la ricerca con interpolazione è, in un 
senso molto generale, la migliore possi¬ 
bile: ogni algoritmo che compia una ri¬ 
cerca in una tabella casuale del tipo de¬ 
scritto deve esaminare, operando gli ap¬ 
propriati confronti, approssimativamen¬ 
te log 2 log 2 n ingressi, in media. 

La rilevanza teorica di questo risultato 
è grande; l’esperienza sui calcolatori ha 
tuttavia mostrato che una ricerca per in¬ 
terpolazione non costituisce, in pratica, 
un perfezionamento della ricerca bina¬ 
ria. Ciò perché i dati immagazzinati in 
una tabella non sono in generale suffi¬ 
cientemente casuali per conformarsi alla 
assunzione di distribuzione uniforme; i- 
noltre n è solitamente tanto piccolo che i 
calcoli aggiuntivi richiesti da ogni con¬ 
fronto comportano una perdita di tempo 
superiore a quello risparmiato con la di¬ 
minuzione dei confronti. La semplicità è 
una delle virtù della ricerca binaria, ed è 
importante mantenere un giusto rappor¬ 
to tra teoria e pratica. 

Ricerca ad albero binario 

La ricerca binaria può peraltro essere 
perfezionata, lasciando cadere l’assun¬ 
zione che ogni chiave della tabella abbia 
le stesse probabilità di venire cercata. 
Quando si supponga che certe chiavi pos¬ 
sano venir consultate più spesso di altre, 
un algoritmo efficiente le esaminerà per 
prime. 

Prima di approfondire questo concet¬ 
to può essere utile guardare alla ricerca 
binaria da un’altro punto di vista. Con¬ 
sideriamo le 31 parole della lingua ingle¬ 
se di uso più comune (secondo quanto 
riporta Helen Fouché Gaines nel suo li¬ 
bro Cryptanalysis). Se queste vengono 
ordinate alfabeticamente nelle posizioni 
KEY[1], KEY[2], KEY[3], ..., KEY[31] 
della tabella, l’algoritmo B confronterà 
la parola cercata x con il punto centrale 


KEY[16], che è la parola «I»; se x è alfa¬ 
beticamente precedente rispetto a «I», il 
confronto successivo avverrà con KEY[8], 
la parola «by»; qualora sia invece se¬ 
guente, verrà esaminata KEY[24]: «that». 
In altri termini, l’algoritmo B agisce sul¬ 
la tabella ricalcando una struttura che 
appare simile a un albero capovolto, par¬ 
tendo dalla sommità e muovendosi verso 
il basso, a sinistra quando x sia prece¬ 
dente, a destra quando sia seguente (si 
veda l’illustrazione in alto a pagina 154). 
Non è difficile accorgersi che ogni algo¬ 
ritmo progettato per compiere una ricer¬ 
ca in una tabella ordinata operando sem¬ 
plicemente dei confronti può venire de¬ 
scritto da un albero binario di questo 
tipo. 

L’albero di ricerca binaria è definito 
implicitamente nell’algoritmo B dalle o- 
perazioni aritmetiche su I, r, e j. È possi¬ 
bile definirlo esplicitamente immagazzi¬ 
nando nella tabella stessa le informazio¬ 
ni sull’albero. A questo scopo sia 
LEFT[/] la posizione della tabella da con¬ 
sultare se x <KEY[/], e sia RIGHT[/'] se 
x>KEY[/]. Così, in un elenco di 31 paro¬ 
le si avrebbe LEFT[16] uguale a 8 e 
RIGHT[16] uguale a 24, poiché la ricer¬ 
ca parte da KEY[16] e procede con 
KEY[8] oppure con KEY[24], Se la ricer¬ 
ca termina con un insuccesso dopo che si 
sia appurato che la parola x precede o 
segue KEY[/], poniamo rispettivamente 
LEFT[/] o RIGHT[/] pari a 0. Nelle illu¬ 
strazioni di pagina 16 questi 0 sono rap¬ 
presentati dai piccoli quadrati che costi¬ 
tuiscono i nodi alla base dell’albero. 

La posizione della prima parola esa¬ 
minata è detta comunemente «radice»; 
nell’esempio delle 31 parole la radice è 
16. È possibile costruire algoritmi di ri¬ 
cerca che non abbiano inizio esaminando 
KEY[16], e questi, se qualche parola è 
consultata più frequentemente delle al¬ 
tre, possono essere anche più efficienti 
deH’algoritmo B. Una procedura di ri¬ 
cerca ad albero generalizzata è costituito 
dal seguente algoritmo: 


Algoritmo C; ricerca ad albero binario. 

Cl. [Inizio.] Uguaglia j alla posizione 
della radice dell’albero binario. 

C2. [Esito negativo?] Se j= 0, j in u- 
scita, e l’algoritmo si arresta. 

C3. [Confronto.] Se x=KEY[/], j in 
uscita e l’algoritmo si arresta. Se x< 
<KEY[/'], ponì / < -LEFT[/] e vai al passo 
C2. Sex>KEY[/'], poniy'^-RIGHTt/] e tor¬ 
na al passo C2. 

L’algoritmo C assomiglia a un testo 
per l’istruzione programmata in cui, a 
seconda delle risposte fornite a opportu¬ 
ni quesiti, viene indicata al lettore la pa¬ 
gina con cui proseguire. Esso funziona 
con qualsiasi albero binario in cui tutte 
le chiavi accessibili da LEFT[/] preceda¬ 
no KEY[/], mentre lo seguano quelle rag¬ 
giungibili da RIGHT[/'], e ciò per tutte le 
posizioni j. Un albero siffatto è detto di 
ricerca binaria. 

Uno dei vantaggi dell’algoritmo C sul¬ 
l’algoritmo B è l’assenza di calcoli nu¬ 
merici, il che rende più rapida la ricerca 
sul calcolatore. Ma il vantaggio princi¬ 
pale dell’algoritmo C è dovuto alla sua 
particolare flessibilità, determinata dalla 
struttura ad albero: gli ingressi della ta¬ 
bella possono ora venire risistemati in 
qualsivoglia ordine. Non è più necessario 
che KEY[1] preceda KEY[2], e così via 
fino a KEY[«]: fintanto che LEFT e 
RIGHT definiscono un albero di ricerca 
binario valido, la posizione effettiva del¬ 
le chiavi nella tabella è irrilevante. Ciò 
significa che possiamo aggiungere nuovi 
ingressi alla tabella, senza dover spostare 
gli altri. Così, la parola «has» può venire 
addizionata all’albero binario di ricerca 
delle 31 parole inglesi più comuni, sem¬ 
plicemente ponendo KEY[32] < -«has», e 
cambiando RIGHT [/'] da 0 a 32 quando j 
sia la posizione della chiave «has». Si 
potrebbe pensare che le aggiunte all’e¬ 
stremità dell’albero potrebbero squili¬ 
brarne la struttura, si dimostra invece che, 
se i nuovi ingressi sono aggiunti in or¬ 
dine casuale, il risultato sarà equilibrato. 
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derido l’insieme vuoto 0 per un oggetto che non goda di alcuna di tali 
caratteristiche). Tali otto possibilità si combinano poi con le sole 2 20 
possibili risposte alle 20 domande sì-no. Si può usare un’argomenta¬ 
zione del tutto simile per mostrare che un algoritmo che ponga al 


massimo 20 quesiti «minore-uguale-maggiore», non può distinguere 
più di 2 20 —1 differenti chiavi, poiché 1+ 2 + 4 +8 + ...+2 19 = 2 20 —1. 
Poiché la ricerca binaria è in grado di raggiungere questo limite 
massimo, è il più efficiente algoritmo di ricerca di questo tipo. 


Alberi di ricerca binari ottimali 

Poiché l’algoritmo C si applica a qual¬ 
siasi albero di ricerca binaria, è possibile 
adattarlo alle proprie esigenze, in modo 
da esaminare per prime le chiavi di mag¬ 
gior consultazione. Una tale modifica ri¬ 
duce il tempo medio impiegato dall’ela¬ 
boratore per completare la ricerca. L’il¬ 
lustrazione in basso della pagina seguen¬ 
te mostra l’albero di ricerca ottimale per 
le 31 parole inglesi più comuni. Il nume¬ 
ro medio di confronti necessari per tro¬ 
vare x in questo albero di ricerca binario 
ottimale è solo 3,437, mentre in un albe¬ 
ro di ricerca binario equilibrato tale nu¬ 
mero sale a 4,393. Vale la pena di osser¬ 
vare che l’albero ottimale, basato sulla 
frequenza delle parole, non parte dal 
confronto di x con la parola «thè». Seb¬ 
bene «thè» sia di gran lunga la parola in¬ 
glese più comune, è troppo avanti nel¬ 
l’ordinamento alfabetico e troppo lonta¬ 
na dal centro della lista per servire da 
radice ottimale. 

Dal punto di vista matematico tradi¬ 
zionale è addirittura banale identificare 
l’albero binario ottimale per un partico¬ 
lare insieme di n parole e frequenze, poi¬ 
ché di tali alberi ne esiste solo un nume¬ 
ro finito. In linea di principio è suffi¬ 
ciente compilarne una lista esaustiva e 
scegliere quello che funziona meglio. In 
realtà questa è una strada impraticabi¬ 
le, visto che il numero di alberi costrui¬ 
bili con n elementi è (2 ri)\/n\(n + 1 )!, do¬ 
ve n ! indica il prodotto Ix2x3x...x«. 
Questa formula rivela l’enorme numero 
di alberi bi nari e sistenti, approssimativa¬ 
mente 4 n /\J tt n 3 . Per esempio, se n è 31, 
il numero totale degli alberi binari è 
14 544 636 039 226 909, e ognuno di que¬ 
sti 14 trilioni di alberi sarà ottimale per 
qualche particolare insieme di frequenze 
assegnato alle 31 parole. Com’è allora 
possibile stabilire che l’albero scelto sia il 
migliore per le frequenze indicate dalla 
Gaines? Anche il più rapido dei moderni 
calcolatori non è abbastanza veloce per 


esaminare singolarmente tutte le possibi¬ 
lità: se venisse esaminato un albero per 
microsecondo, occorrerebbero 460 anni. 

Disponiamo però di un importante 
principio che rende possibile il calcolo: 
ogni sottoalbero di un albero ottimale 
deve essere esso stesso ottimale. Nell’al¬ 
bero ottimale di ricerca binaria per il 
problema delle 31 parole, il sottoalbero 
alla sinistra della parola «of» deve rap¬ 
presentare il miglior metodo di ricerca 
per le venti parole da «a», «and» e così 
via fino a «not». Se esistesse un metodo 
migliore, ci dovrebbe condurre a un al¬ 
bero complessivamente migliore, da cui 
seguirebbe la non-ottimalità dell’albero 
in esame. Analogamente, il sottoalbero, 
ancora più piccolo alla destra di «for» 
deve rappresentare il miglior metodo di 
ricerca per le 11 parole da «from», «had», 
fino a «not». Ogni sottoalbero corrispon¬ 
de a un insieme di parole consecutive 
KEY[/], KEY[/+ 1]...KEY[/], con 1 < / < 
j < n. È possibile determinare tutti i sot¬ 
toalberi ottimali identificando dapprima 
i più piccoli, e proseguendo la computa¬ 
zione per valori via via crescenti di j — i. 
Per ogni scelta degli indici i e j, esistono 
j —; + l possibili radici del sottoalbero. 
Se, procedendo con la computazione lun¬ 
go l’albero, consideriamo ogni possibile 
radice di sottoalbero, possiamo constata¬ 
re che i sottoalberi ottimali di destra e di 
sinistra sono già stati identificati. 

In questo modo è possibile giungere al 
miglior albero di ricerca in sole n 3 opera¬ 
zioni. In effetti è stato possibile miglio¬ 
rare il metodo, tanto da ridurre il nume¬ 
ro di operazioni richieste a ri 1 . Nel caso 
delle 31 parole più frequenti ciò significa 
che l’albero di ricerca binario ottimale 
può essere identificato dopo soli 961 pas¬ 
si, invece di 14 quadrilioni. 

Si potrebbe osservare che nei prece¬ 
denti paragrafi si sono analizzati svariati 
algoritmi, il cui solo scopo è quello di 
determinare l’albero binario di ricerca 
più efficiente. In altri termini, il risultato 
fornito da questi algoritmi è esso stesso 


un algoritmo, destinato alla soluzione di 
un problema diverso! L’esempio aiuta a 
comprendere perché la scienza dei calco¬ 
latori si sia sviluppata tanto rapidamente 
come una disciplina autonoma. Studian¬ 
do l’uso corretto dei calcolatori, ci si 
imbatte in problemi di per sé interessan¬ 
ti, e molti di questi richiedono tecniche e 
concetti interdipendenti. 

Può essere stimolante e istruttivo con¬ 
siderare il peggior albero di ricerca bina¬ 
ria possibile per le 31 parole inglesi più 
comuni, tanto per vedere a quali rovino¬ 
si risultati sia possibile giungere con l’al¬ 
goritmo C. Possiamo definire un siffatto 
albero «pessimale» in n 1 operazioni cir¬ 
ca, come nel caso ottimale. Per le fre¬ 
quenze indicate dalla Gaines, l’albero di 
ricerca binario «pessimale», costringe, in 
media, a operare 19 158 confronti per 
ricerca. Tanto per fare un paragone, il 
peggior ordinamento delle chiavi per una 
ricerca sequenziale porta l’algoritmo A a 
operare in media ben 22 907 confronti 
per ricerca. Quindi, il peggior caso del¬ 
l’algoritmo C non sarà mai infame quan¬ 
to quello dell’algoritmo A. 

Hashing 

Gli algoritmi di ricerca finora conside¬ 
rati erano strettamente correlati alla tec¬ 
nica di consultazione di un dizionario. 
Per esaminare una grande massa di paro¬ 
le con un elaboratore esiste tuttavia una 
ottima alternativa. Questa, chiamata ha¬ 
shing (miscuglio), costituisce un approc¬ 
cio completamente diverso al problema, 
inutilizzabile da un operatore umano, 
basato com’è sulla capacità delle mac¬ 
chine di fare calcoli ad altissima velocità. 
L’idea è quella di trattare le lettere delle 
parole come se fossero numeri (a=l, 
b = 2, ...z = 26), e quindi di rimescolare i 
numeri, in modo da assegnare a ogni 
parola un singolo numero. Il numero è 
l’hash-indirizzo della parola e indica al 
calcolatore dove cercare la parola nella 
tabella. 
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Nel caso delle 31 parole inglesi più 
comuni potremmo convertire ogni chiave 
in un numero compreso tra 1 e 32, som¬ 
mando il valore numerico delle rispettive 
lettere e prendendo il resto della divisio¬ 
ne per 32. Così, l’hash-indirizzo di «thè» 
sarebbe 20 + 8 + 5—32 = 1, quello di «of» 
risulterebbe essere 15 + 6 = 21, e così via 
per il resto della lista. Se si è fortunati, 


ogni parola disporrà di un differente 
hash-indirizzo e le ricerche diventeranno 
veramente spedite. 

In generale, supponiamo di voler me¬ 
morizzare n chiavi nelle m posizioni di 
memoria di un elaboratore, dove m è 
maggiore di n. Poiché « = 31, diciamo 
che m è uguale a 32. Supponiamo inoltre 
che esista una hash-funzione h(x), che 


assegni a ogni parola x un numero tra 1 
e m. Una hash-funzione è adeguata se è 
improbabile che h(x) e h(y) siano uguali 
quando x e y sono parole diverse. 

A meno che m non sia molto più 
grande di n, quasi tutte le hash-funzioni 
portano, però, a qualche «collisione» tra 
i valori h(x) e h(y). È estremamente im¬ 
probabile che n numeri casuali indipen- 
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Nell’algoritmo B è implicito un albero di ricerca binaria; quello qui 
raffigurato illustra graficamente l’ordine in cui l’algoritmo B esamina 
una tabella alfabetica composta dalle 31 parole inglesi più frequenti. 
Partendo dalla radice, o sommità, dell’albero, la parola in ingresso x 
viene confrontata con il punto centrale della tabella, la parola «I». Se 
x precede alfabeticamente «I», la ricerca prosegue lungo la ramifica¬ 
zione di sinistra; se * è invece successiva, lungo quella di destra. Così, 
se x è la parola «from», si constata dapprima che x precede «I», 


quindi che segue «by», precede «have» e infine coincide con «from». 
Se x non fosse in tabella, la ricerca si fermerebbe a uno dei 32 zeri 
( quadratini ) sotto l’albero. Quando le ramificazioni vengono rappre¬ 
sentate esplicitamente nella memoria del calcolatore, piuttosto che im¬ 
plicitamente, come neU’algoritmo B (il che richiede il calcolo del 
punto centrale), la ricerca prosegue più spedita e l’inserimento di 
nuove informazioni viene agevolato: così, la parola «had», (in grìgio) 
può essere inserita, in ordine alfabetico, al posto di uno degli zeri. 



IT 


ON 


THIS 


WITH 


TT 

1344 


~7T 

1093 


TT 

2292 





L’albero di ricerca binaria ottimale, che mostra la migliore disposizio¬ 
ne possibile delle 31 parole, si basa sulle frequenze relative (riportate 
sotto ogni parola). L’albero non è perfettamente bilanciato come nel 
caso precedente; di conseguenza la ricerca sarà in qualche caso più 
lunga. Per identificare la parola «from» saranno necessari, con 


questo albero, sei passi invece di quattro (sentieri in grìgio e in 
colore). In media però l’albero ottimale consente a un calcolatore mi¬ 
gliori prestazioni, poiché le parole più comuni sono esaminate per 
prime. Si noti che la parola «thè», pur essendo la più frequente, non 
si trova alla radice, perché troppo lontana dal centro dell’alfabeto. 
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denti tra 1 e m siano tutti differenti. 
Consideriamo un esempio banale: è noto 
che quando 23 o più persone siano pre¬ 
senti in una stanza, vi sono buone pro¬ 
babilità che due di queste siano nate 
nello stesso giorno dell’anno. D’altra par¬ 
te, in un gruppo di 88 persone è verosi¬ 
mile che ci siano tre individui nati nello 
stesso giorno dell’anno. Per quanto il 
fenomeno sembri paradossale a molta 
gente, il controllo matematico è sempli¬ 
ce, e molte altre coincidenze apparente¬ 
mente impossibili possono essere spiega¬ 
te allo stesso modo. 

Il paradosso del compleanno può esse¬ 
re riformulato dicendo che una hash-fun- 
zione con m = 365 e « = 23 porterà ad 
almeno una collisione, più spesso che no. 
Ogni procedura di ricerca basata su hash- 
-funzioni deve essere dunque in grado di 
far fronte al problema della collisione. 

Supponiamo di voler consultare una 
tabella per x, ma che l’indirizzo h(x) sia 
già occupato dalla parola y. Il modo più 
semplice di trattare la collisione consiste 
nell’esaminare le posizioni h(x), h(x) —1, 
h(x )—2, fino a che non si trovi x o si 
giunga a una posizione vuota. Se la ri¬ 
cerca giunge al termine della tabella pri¬ 
ma di averla consultata tutta, ricomincia 
dall’altro capo. Questa procedura, detta 
a scandaglio lineare, può essere espressa 
sotto forma di algoritmo: 

Algoritmo D; hashing con scandaglio 
lineare. 

DI. [Inizio.] Poni j*~h(x). 

D2 [Esito negativo?] Se l’ingresso j 
della tabella è vuoto, 0 in uscita e l’algo¬ 
ritmo termina. 

D3. [Esito positivo?] Se * = KEY[/], j 
in uscita e l’algoritmo termina. 

D4. [Passaggio alla posizione successi¬ 
va.] Poni j*~j —1; se j = 0 poni j*~m (La 
posizione m è considerata vicina alla po¬ 
sizione 1.) Ritorna a D2. 

Se x non è in tabella e l’algoritmo 
termina senza successo al passo D2 per¬ 
ché l’ingresso j della tabella è vuoto, po¬ 
tremo porre KEY[/] < -x, utilizzando il va¬ 
lore di j in questione. Una successiva 
ricerca di x, seguendo esattamente la 
stessa strada, a partire da h(x ) per muo¬ 
versi poi in h(x )—1 , ecc, troverà x nella 
posizione j. In questo modo la ricerca 
procederà correttamente anche in caso di 
collisioni. 

Ritornando all’esempio delle 31 paro¬ 
le, supponiamo che queste vengano inse¬ 
rite una a una in ordine decrescente di 
frequenza («thè» per prima, «of» per se¬ 
conda, ecc.) a partire da una tabella 
vuota. Il risultato è la hash-tabella a 
sinistra nell’illustrazione della pagina se¬ 
guente. La maggior parte delle parole 
appare al proprio hash-indirizzo o nelle 
immediate vicinanze; fanno eccezione 


L’albero «pessimale» è il peggiore tra gli alberi 
di ricerca binari per le 31 parole più frequenti 
della lingua inglese. In questo caso vanno persi 
i vantaggi della struttura ad albero, poiché per 
ogni confronto abbiamo un ramo «morto». 
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quelle inserite per ultime. La parola me¬ 
no frequente, «this», si trova nella posi¬ 
zione 8, nonostante che il suo indirizzo 
sia 24, perché le posizioni dal 9 al 24 
erano già occupate quando è stata inseri¬ 
ta. Malgrado queste anomalie il numero 
medio di unità di tempo necessarie all’al¬ 


1 

THE 

(1) 

2 

HAVE 

(4) 

3 

TO 

(3) 

4 

HIS 

(4) 

5 



6 

BE 

(7) 

7 

FOR 

(7) 

8 

THIS 

(24) 

9 

1 

(9) 

10 

BUT 

(11) 

11 

WAS 

(11) 

12 

HAD 

(13) 

13 

HE 

(13) 

14 

FROM 

(20) 

15 

AT 

(21) 

16 

NOT 

(17) 

17 

THAT 

(17) 

18 

WHICH 

(19) 

19 

AND 

(19) 

20 

AS 

(20) 

21 

OF 

(21) 

22 

ON 

(29) 

23 

IN 

(23) 

24 

ARE 

(24) 

25 

YOU 

(29) 

26 

BY 

(27) 

27 

WITH 

(28) 

28 

IS 

(28) 

29 

IT 

(29) 

30 

HER 

(31) 

31 

OR 

(1) 

32 

A 

(1) 


goritmo D per trovare una parola si ag¬ 
gira intorno a 1,666: meno della metà 
rispetto ai confronti richiesti per indivi¬ 
duare la parola utilizzando l’albero di 
ricerca binario ottimale. Al tempo di 
consultazione bisogna aggiungere quello 
necessario a calcolare h(x) al passo DI; 
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La hash-tabella costituisce una buona soluzione per esaminare grandi quantità di dati con un 
calcolatore; sfruttandone infatti la capacità di operare calcoli ad alta velocità, possiamo ottenere, 
per ogni parola x, il rispettivo indirizzo h(x) già all’inizio della ricerca (il numero in parentesi 
accanto alla parola). Nell’esempio l’indirizzo è ottenuto sommando i valori numerici di ogni 
lettera (A = 1, b = 2...Z = 26), dividendo per 32 il risultato e considerando il resto. Talvolta a due 
parole x e y corrisponde uno stesso indirizzo h(x), avviene così una «collisione». Se x non si trova 
in h(x), la ricerca prosegue esaminando h(x) —1, h(x) —2, ecc. Così, l’indirizzo di «his» èh+i + s, 
cioè 8 + 9+19—32 = 4. L’indirizzo di «have» è anch’esso 4; per trovarne la posizione effettiva 
l’algoritmo esamina quindi la posizione 4 (grigio chiaro), quindi la 3 (grigio scuro) e infine la 2 
(colore), dove appunto si trova «have». Seat non fosse in tabella, la ricerca terminerebbe alla posi¬ 
zione vuota 5. La hash-tabella ordinata (a destra) combina il concetto di hash con i vantaggi del¬ 
l’ordinamento alfabetico e si rivela particolarmente efficiente quando la parola x non figura nella 
tabella. Tutte le parole tra h(x) e la posizione effettiva di x sono alfabeticamente successive a x. 
Una ricerca senza esito non si fermerà quindi necessariamente alla posizione vuota S, ma non 
appena incontri una parola alfabeticamente precedente a x. Per x uguale a «has», il cui indirizzo 
è 28 (grigio chiaro), la ricerca si ferma alla posizione 22 corrispondente a «by» (grigio scuro). 


ma anche così, per una grande quantità 
di dati, il metodo dello hashing supera 
decisamente qualsiasi algoritmo di con¬ 
fronto binario. 

In pratica è preferibile evitare di riem¬ 
pire la tabella come nell’esempio. Il nu¬ 
mero m delle posizioni tabellari è solita¬ 
mente scelto sufficientemente alto, in 
modo da saturare la tabella all’80-90 per 
cento. Si può dimostrare che il numero 
medio di prove necessarie a trovare una 
parola tra n ugualmente probabili, che 
siano state inserite in modo casuale in 
una tabella di lunghezza m, è 1 + [(«—1)/ 
/m + (n —1) (n —2)/m 2 + (n—1) (n— 2) 
(n —3 )/m 3 + ...]/2. 

Sia a la ragione di riempimento o «fat¬ 
tore di carico» n/m della tabella. Per n 
tendente all’infinito, il numero medio di 
prove richieste per trovare una qualsiasi 
parola in un elenco approssima il valore 
1+(a+a 2 + a 3 +...)/2, che equivale a 
[1 + 1/(1—a)]/2. Peraltro, l’effettivo nu¬ 
mero medio di prove sarà sempre minore 
di questo valore limite. Se poi la tabella 
in esame è carica all’80 per cento, l’algo¬ 
ritmo D eseguirà in media 3 consultazio¬ 
ni per ricerca riuscita. 

E da notare che il limite superiore sta¬ 
bilito vale per tutte le tabelle a parità di 
carico, indipendentemente dalla loro lun¬ 
ghezza. Lo stesso non può dirsi nel caso 
dell’algoritmo a confronto binario, in 
cui il tempo di ricerca medio aumenta 
indefinitamente al crescere del numero n 
delle parole da esaminare. 

Indagini senza esito 

Le osservazioni del paragrafo prece¬ 
dente circa l’esiguo numero di prove ri¬ 
chieste dall’algoritmo D, valgono solo 
quando x si trovi effettivamente nella ta¬ 
bella. Se x non c’è, il numero medio di 
confronti necessari ad accertare il fatto è 
maggiore, e precisamente 1 + [2 n/m + 
+ 3«(n— l)/m 2 + 4n(n— l)(n—2 )/m 3 
+ ...\/2, che al crescere di n si approssi¬ 
ma a [1 + 1/(1—a) 2 ]/2. In altre parole, 
una ricerca a vuoto in un hash-tabella 
riempita all’80 per cento, richiede in me¬ 
dia 13 prove. D’altronde nell’esempio 
delle 31 parole immagazzinate in 32 po¬ 
sizioni tabellari, si può notare come tutte 
le ricerche a vuoto terminino all’unica 
posizione vuota, 5, indipendentemente 
da quella dell’indirizzo di partenza h(x). 
Una situazione analoga si presenta con 
l’algoritmo a ricerca sequenziale A, le 
cui ricerche a vuoto terminano tutte alla 
posizione 0. 

Nel 1973 O. Amble dell’Università di 
Oslo ha osservato che il problema della 
ricerca a vuoto può essere sdrammatiz¬ 
zato, combinando i due concetti di 
hashing e di ordinamento alfabetico. In¬ 
seriamo le 31 parole inglesi più comuni 
in una tabella in ordine alfabetico inver¬ 
so, invece che in ordine di frequenza de¬ 
crescente. Poiché la tabella viene consul¬ 
tata a partire da h(x), passando a h(x)— 1, 
ecc, tutte le parole collocate tra l’indiriz¬ 
zo h(x) e l’effettiva posizione di x devo¬ 
no precedere alfabeticamente x, nell’eve¬ 
nienza di collisioni. La ricerca di x può 
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quindi terminare (a vuoto), quando si 
incontri una parola alfabeticamente se¬ 
guente a x. Ciò equivale al seguente: 

Algoritmo E; scandaglio lineare in una 
hash-tabella ordinata. Questo algoritmo 
assume che KEY[/'] sia 0, quando l’ingres¬ 
so j è vuoto, e che tutte le parole x assu¬ 
mano un valore numerico maggiore di 0. 

El. [Inizio.] Poni j*~h(x). 

E2. [Esito negativo?] Se KEY[/]<x, 0 
in uscita e l’algoritmo termina. 

E3. [Esito positivo?] Se KEY[/']=x, j 
in uscita e l’algoritmo termina. 

E4. [Passaggio al successivo.] Poni 
j*~j —1; se v = 0, poni j*~m. Torna al 
passo E2. 

L’utilità dell’algoritmo E è rilevabile 
dalla hash-tabella ordinata mostrata nel¬ 
la parte destra dell’illustrazione della pa¬ 
gina a fronte. Supponiamo di voler de¬ 
terminare se «has» sia una delle 31 paro¬ 
le più usate in inglese; il suo hash-indi- 
rizzo è 8 + 1 + 19 = 28. L’algoritmo E ter¬ 
mina la ricerca in sei passi, quando arri¬ 
va a 7 = 22 («by»), senza percorrere la 
tabella fino all’ingresso vuoto a 7 = 5. 

In una hash-tabella ordinata il numero 
medio di sondaggi per ricerca a vuoto si 
riduce a 1 + [n/m + n(n — l)/m 2 + n(n —1) 
(n — 2)/m 3 + ...]/2, un numero quasi sem¬ 
pre minore di [1 + 1/(1—a)]/2. Quindi, 
sia per una ricerca con esito positivo sia 
per una a esito negativo, il limite è lo 
stesso. Per una tabella carica all’80 per 
cento l’algoritmo E effettuerà in media 
tre sondaggi, quale che sia n. 

Ciò vale quando l’hash-tabella sia sta¬ 
ta costruita inserendo le chiavi in ordine 
alfabetico decrescente, nel modo descrit¬ 
to. In pratica, tuttavia, non è sempre 
possibile assumere una tale struttura del¬ 
la tabella. Spesso le tabelle variano dina¬ 
micamente con l’uso, venendo introdotte 
in ordine casuale sempre nuove parole. 
Mentre la struttura di un albero di ricer¬ 
ca binario (algoritmo C) e di una hash- 
-tabella non ordinata (algoritmo D) pos¬ 
sono adattarsi senza difficoltà a tali ac¬ 


crescimenti dinamici, io stesso non può 
dirsi della struttura di una hash-tabella 
ordinata. Fortunatamente disponiamo di 
un algoritmo molto semplice, che con¬ 
sente l’inserimento di nuove parole in 
una simile tabella. 

Algoritmo F; inserimento di una nuo¬ 
va parola in una hash-tabella ordinata. 
Questo algoritmo introduce la parola x e 
riordina gli altri ingressi, in modo da 
preservare la validità della ricerca del¬ 
l’algoritmo E. 

FI. [Inizio.] Poni j^h(x). 

F2. [Confronto.] Se KEY[/]<xr, scam¬ 
bia i valori di KEY[/] e x (Vale a dire: 
poni x al precedente valore di KEY[/] e 
poni KEY[/] al precedente valore di x). 

F3. [Termine?] Se x = 0 l’algoritmo si 
arresta. 

F4. [Passaggio al successivo.] Poni 
j*-j —1; se 7 = 0 poni nuovamente 
Torna al passo F2. 

Se decidessimo di inserire con l’algo¬ 
ritmo F la parola «has» nella hash-tabel¬ 
la delle 31 parole inglesi di uso più co¬ 
mune, la procedura collocherebbe «has» 
nella posizione 22, grazie al trasferimen¬ 
to di «by» dalla posizione 22 alla 18, di 
«at» dalla 18 alla 15, di «as» dalla 15 
alla 14, di «are» dalla 14 alla 8, e infine 
di «and» dalla 8 alla 5. Il lavoro può 
sembrare molto, ma il tempo impiegato 
è appena superiore a quello necessario a 
inserire «has» in una hash-tabella non 
ordinata, utilizzando l’algoritmo D. Ge¬ 
neralmente l’inserimento di una parola 
in una hash-tabella ordinata comporta lo 
stesso numero di iterazioni dell’inserzio¬ 
ne della stessa parola in una hash-tabella 
non ordinata. Inoltre il numero medio di 
parole che deve essere spostato al passo 
F2, per far posto alla nuova parola, è 
(n — \)/2m +2(n —1) (ri — 2)/3m 2 + 3(n — 
—1) (n —2)/4 m 3 + ... approssimativamen¬ 
te uguale a 1/(1 — a) + [log e (l — a)]/a, 
dove e sta per 2,71828. L’impegno ri¬ 
chiesto all’algoritmo F per l’inserimen¬ 
to di una parola è quindi ragionevole. 


Nel caso specifico non abbiamo potu¬ 
to inserire effettivamente «has» nella ta¬ 
bella, poiché occorre mantenervi vuota 
almeno una posizione. Nella nostra ta¬ 
bella completa è presente la prima parola 
dell’ordinamento alfabetico, «a», quindi 
Io scandaglio lineare dell’algoritmo F 
funzionerà in tutti i casi. Se «a» non 
comparisse nella tabella, sarebbe neces¬ 
saria una posizione vuota, per evitare 
una ricerca senza termine qualora la pa¬ 
rola in entrata fosse proprio «a». 

Una delle più sorprendenti caratteristi¬ 
che delle hash-tabelle ordinate è la loro 
unicità. Dato un qualsiasi insieme di pa¬ 
role, se utilizziamo l’algoritmo F per co¬ 
struirne una, otterremo sempre la me¬ 
desima tabella quale che sia l’ordine di 
inserimento delle parole. 

Conclusioni 

La mia discussione sulle modalità di 
ricerca delle informazioni immagazzinate 
nella memoria di un calcolatore era in¬ 
tesa a illustrare alcuni punti di importan¬ 
za generale concernenti gli algoritmi. Ab¬ 
biamo visto che un algoritmo deve essere 
descritto puntualmente, e ciò è più diffi¬ 
cile di quanto non sembri. Quando si 
tenta di risolvere un problema con l’aiu¬ 
to di un calcolatore, il primo algoritmo 
che viene in mente può spesso venire per¬ 
fezionato. La strutturazione dei dati (si 
vedano gli alberi binari) è un fattore de¬ 
terminante per la costruzione di un algo¬ 
ritmo efficiente. Quando si comincia a 
studiare la velocità di un algoritmo o si 
cerca il più adatto a una particolare ap¬ 
plicazione, si giunge spesso a risultati 
interessanti e si può constatare che le ri¬ 
sposte ai quesiti che man mano sorgono, 
sono molto sottili. Talvolta proprio il 
«migliore» degli algoritmi può essere per¬ 
fezionato modificando le regole di base. 
Poiché i calcolatori «pensano» in modo 
differente dalle persone, i canoni opera¬ 
tivi adatti alla mente umana non sono 
necessariamente i più efficienti quando 
siano trasferiti sulle macchine. 
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La teoria delle catastrofi 

Le trasformazioni che avvengono in modo improvviso hanno resistito a 
lungo a un’analisi matematica; oggi è possibile descrivere con metodi 
topologici tali fenomeni in termini di sette catastrofi elementari 

di E.C. Zeeman 


I ricercatori si servono spesso della co¬ 
struzione di modelli matematici per 
descrivere i fenomeni. Anzi, quando 
questo tipo di modelli si rivela partico¬ 
larmente efficace e fruttuoso, si suol dire 
che esso non solo descrive i fenomeni, 
ma anche «li spiega»; se il modello può 
essere ricondotto a una equazione sem¬ 
plice può anche essere considerato come 
una legge naturale. Il metodo più diffuso 
nella costruzione di modelli di questo 
tipo è da 300 anni in qua il calcolo dif¬ 
ferenziale ideato da Newton e Leibniz. 
Newton stesso espresse le sue leggi del 
moto e della gravitazione come equazio¬ 
ni differenziali, e James Clerk Maxwell 
se ne servì per la sua teoria dell’elettro¬ 
magnetismo. Anche la teoria generale 
della relatività di Einstein si può esprime¬ 
re in una serie di equazioni differenziali. 
E a questi esempi se ne potrebbero ag¬ 
giungere molti altri meno noti. Tuttavia, 
le equazioni differenziali usate come lin¬ 
guaggio descrittivo presentano un limite 
intrinseco: possono descrivere soltanto 
quei fenomeni di trasformazione in cui il 
cambiamento avviene in maniera gradua¬ 
le e continua. In termini matematici le 
soluzioni di un’equazione differenziale 
devono essere funzioni differenziabili. 
Sono relativamente pòchi i fenomeni che 
hanno un andamento regolare e ordina¬ 
to; al contrario, il mondo è pieno di tra¬ 
sformazioni improvvise e di imprevedibi¬ 
li discontinuità che richiedono l’uso di 
funzioni che non sono differenziabili. 

Soltanto recentemente è stato elabora¬ 
to un metodo matematico per descrivere 
i fenomeni discontinui e divergenti. Que¬ 
sto metodo è potenzialmente in grado di 
descrivere l’evoluzione dei sistemi in o- 
gni manifestazione naturale, e perciò 
comporta una vasta generalità; può esse¬ 
re applicato con particolare efficacia in 
quelle situazioni in cui forze e motiva¬ 
zioni che cambiano gradualmente porta¬ 
no a cambiamenti improvvisi del com¬ 
portamento. Per questo motivo il meto¬ 
do è stato chiamato «teoria delle cata¬ 
strofi». Molti fatti nel campo della fisica 
possono ora essere classificati come e- 
sempi di catastrofi. Tuttavia, le applica¬ 
zioni più rilevanti di questa teoria pos¬ 


sono essere effettuate nel campo della 
biologia e delle scienze sociali, dove i 
fenomeni discontinui e divergenti sono i 
più diffusi, e in cui altre tecniche mate¬ 
matiche si sono dimostrate così larga¬ 
mente insufficienti. La teoria delle cata¬ 
strofi potrebbe perciò fornire un linguag¬ 
gio matematico a quelle scienze che sono 
dette ancor oggi «inesatte». 

La teoria della catastrofe è stata ela¬ 
borata da René Thom dell’Istituto di 
studi scientifici superiori di Bures-sur- 
-Yvette in Francia. Egli espone la sua 
teoria in un libro pubblicato nel 1972, 
Stabilité Structurelle et Morphogénèse. 
La teoria fa largo uso della topologia, il 
settore della matematica in cui si studia¬ 
no tra l’altro le proprietà delle superfici 
a più dimensioni. Il coinvolgimento della 
topologia è dovuto al fatto che le forze 
che sono presenti nella natura possono 
essere descritte mediante superfici di e- 
quilibrio uniformi; ed è quando l’equili¬ 
brio si spezza che avviene la catastrofe. 
Il problema dunque per la teoria delle 
catastrofi è quello di descrivere la forma 
di tutte le possibili superfici di equilibrio. 
Thom ha risolto questo problema me¬ 
diante alcune strutture basilari che egli 
chiama catastrofi elementari. Per proces¬ 
si determinati da non più di quattro fat¬ 
tori, Thom ha dimostrato che si danno 
esattamente sette catastrofi elementari. 
La dimostrazione del teorema di Thom è 
piuttosto difficile, ma è abbastanza faci¬ 
le comprenderne i risultati. È possibile 
comprendere le catastrofi elementari 
stesse e applicarle ai problemi senza bi¬ 
sogno di riferirsi alla dimostrazione. 

Un modello dell’aggressione 

Per chiarire la natura dei modelli deri¬ 
vati dalla teoria della catastrofe prende¬ 
remo in esame una serie di esempi. Co- 
mincerò con il considerare un modello di 
aggressione nel cane. Konrad Z. Lorenz 
ha notato che il comportamento aggres¬ 
sivo è influenzato da due forze in con¬ 
flitto tra loro: collera e paura, e ha ipo¬ 
tizzato che nel cane queste componenti 
possono essere misurate con una certa 
attendibilità. La collera di un cane è 


correlata al grado di apertura della boc¬ 
ca e di esposizione della dentatura; la 
paura si manifesta da quanto appiattisce 
le orecchie verso la nuca. Prendendo l’e¬ 
spressione del muso come indicatore del¬ 
lo stato emotivo del cane, possiamo cer¬ 
care di stabilire in che misura il suo com¬ 
portamento varia in funzione dell’umore. 

Se è presente soltanto una delle com¬ 
ponenti emozionali in conflitto, la rispo¬ 
sta del cane è relativamente facile da pre¬ 
vedere. Se il cane è adirato allora ci si 
pmò attendere un’azione di tipo aggressi¬ 
vo, come l’attacco. Quando il cane è 
spaventato ma non si provoca la sua 
collera, l’attacco diventa improbabile e il 
cane molto verosimilmente batterà in ri¬ 
tirata. La previsione è univoca anche 
quando non sia presente nessuno stimo¬ 
lo; in questo caso è probabile che il cane 
manifesti un tipo di comportamento neu¬ 
trale, non connesso né all’aggressione né 
alla sottomissione. 

E che cosa succede se il cane si trova a 
provare nello stesso istante collera e pau¬ 
ra? In questo caso le due componenti 
che lo influenzano sono direttamente in 
conflitto. I modelli semplici che non so¬ 
no in grado di esprimere la discontinuità 
potrebbero in questo caso prevedere che 
i due stimoli si annullino a vicenda, dan¬ 
do come risultato un comportamento 
neutrale. Questa previsione dimostra ap¬ 
pieno l’insufficienza esplicativa di tali 
modelli semplicistici, poiché la neutralità 
è di fatto l’ultimo dei comportamenti 
probabili. Quando un cane è nello stesso 
tempo in preda alla collera e alla paura 
sono alte le probabilità di un comporta¬ 
mento fortemente polarizzato in un sen¬ 
so o nell’altro: il cane può attaccare o 
abbandonare, ma non rimarrà indiffe¬ 
rente. Il punto di forza del modello deri¬ 
vato dalla teoria delle catastrofi è che si 
può rendere conto di questa distribuzio¬ 
ne bimodale delle probabilità. E ancora, 
il modello fornisce una base per prevede¬ 
re, in particolari circostanze, quale com¬ 
portamento sceglierà il cane. 

Per costruire il modello, anzitutto rap¬ 
presentiamo i due parametri di control¬ 
lo, collera e paura, su due assi in un 
piano orizzontale, che chiameremo su-. 
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perficie di controllo. Il comportamento 
del cane viene poi misurato su un terzo 
asse, l’asse del comportamento, che è 
perpendicolare ai primi due. Dovremmo 
assumere che esiste una serie continua di 
possibili comportamenti: dalla ritirata 
completa, all’atto di acquattarsi, di 
schermirsi, alla neutralità, al ringhiare e 


arruffare il pelo fino all’attaccare. I mo¬ 
di di comportamento più aggressivi sono 
indicati come valori alti sull’asse del com¬ 
portamento, quelli meno aggressivi con i 
valori bassi. Per ogni punto sulla super¬ 
ficie di controllo (cioè, per ogni combi¬ 
nazione di ira e paura) esiste almeno un 
comportamento più probabile, che rap¬ 


presentiamo con un punto direttamente 
superiore al punto della superficie di con¬ 
trollo collocato a un’altezza corrispon¬ 
dente al comportamento. Ci sarà così un 
solo punto per il comportamento in cor¬ 
rispondenza di molti punti sulla superfi¬ 
cie di controllo, nei quali predomini la 
collera o la paura. Verso il centro del 



L’aggressività nei cani può essere descritta con un modello basato su 
una delle catastrofi elementari. Il modello assume che il comporta¬ 
mento aggressivo sia determinato da due fattori in conflitto tra loro, 
collera e paura, che vengono rappresentate su due assi in un piano 
orizzontale: la superficie di controllo. Il comportamento del cane, 
che va dall’attacco alla ritirata, viene rappresentato su un asse verti¬ 
cale. Per ogni combinazione di collera e paura, e perciò per ogni 
punto della superficie di controllo, esiste almeno una forma di com¬ 
portamento probabile, indicata con un punto sopra il punto corri¬ 
spondente sulla superficie di controllo, ad altezza appropriata sull’as¬ 
se del comportamento. L’insieme di tutti questi punti forma la super¬ 
ficie di comportamento. Nella maggioranza dei casi esiste un solo 
modo di comportarsi probabile, ma nelle zone in cui collera e paura 
approssimativamente si equivalgono, ci sono due modi possibili: un 
cane che sia nello stesso tempo incollerito e spaventato può sia attac¬ 
care sia ritirarsi, quindi ci sono al centro del grafico due piani che 
rappresentano il comportamento possibile, ed essi sono collegati da 
un terzo piano formando una superficie continua e ripiegata. Il terzo 
dei piani, al centro, disegnato in grigio, presenta una significativa 
diversità rispetto agli altri due: rappresenta il comportamento meno 
probabile, in questo caso la neutralità. Verso l’origine la piega sulla 


superficie di comportamento si fa più stretta e alla fine scompare. La 
linea che delimita i confini della piega è detta curva di piegatura, e la 
sua posizione sulla superficie di controllo è una curva a forma di 
cuspide. Poiché la cuspide segna la soglia dove il comportamento 
comincia a diventare bimodale, è chiamata insieme di biforcazione e il 
modello catastrofe a cuspide. Se un cane incollerito viene spaventato, 
il suo umore segue la traiettoria A sulla superficie di controllo. Il 
percorso corrispondente sulla superficie di comportamento si sposta 
verso sinistra sul piano superiore fino a raggiungere la curva di 
piegatura; qui il piano superiore scompare e il percorso va a cadere di 
colpo sul piano inferiore. È qui che il cane interrompe il suo attacco e 
si ritira improvvisamente. Allo tesso modo, un cane spaventato che si 
incollerisce segue la traiettoria B. Il cane resta nel piano inferiore fino 
a che questo piano scompare, e poi non appena salta al piano supe¬ 
riore, smette di ritirarsi e attacca improvvisamente. Un cane che è 
nello stesso tempo incollerito e spaventato deve seguire una delle due 
traiettorie in C. Il fatto che si sposti sul piano superiore e diventi più 
aggressivo o che si sposti sul piano inferiore e diventi più sottomesso 
dipende in maniera critica dai valori della collera e della paura. Un 
lieve cambiamento degli stimoli può essere all’origine di un cambia¬ 
mento assai rilevante del comportamento: il fenomeno é divergente. 
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---COLLERA 

I fattori di controllo nel modello dell’aggressività sono la collera e la paura, che nel cane si 
rilevano dall’espressione del muso: la collera dal grado di apertura della bocca, e la paura dal 
grado di appiattimento delle orecchie verso la nuca. Da questi indicatori è possibile rendersi 
conto dello stato emozionale del cane, e per mezzo del modello prevedere il suo comportamento. 





NÉ RABBIA NÉ PAURA 



Una funzione di probabilità determina il comportamento del cane sotto l’influenza della collera 
e della paura in conflitto. Quando non è presente nessuno stimolo, il comportamento più pro¬ 
babile è quello di neutralità; quando è presente solo la collera, è l’aggressione, quando c’è solo 
la paura, è la resa. Quando il cane è incollerito e spaventato, il grafico della probabilità di¬ 
venta bimodale: l’attacco e la fuga sono entrambe scelte possibili, mentre la neutralità è la 
risposta meno probabile. La bimodalità è rispecchiata nella superficie di comportamento della 
catastrofe a cuspide, che presenta due piani che rappresentano il comportamento più probabile. 


grafico tuttavia, laddove la collera e la 
paura approssimativamente si equivalgo¬ 
no, ogni punto appartenente alla super¬ 
ficie di controllo ha due punti di com¬ 
portamento, uno con valori alti sull’asse 
del comportamento, che rappresenta l’a¬ 
zione di aggressione, l’altro con valori 
bassi che rappresenta l’atto di sottomis¬ 
sione. Possiamo inoltre segnare un terzo 
punto, che verrà sempre a cadere tra 
questi due, che rappresenta il comporta¬ 
mento più neutrale meno probabile. 

Se individuiamo i punti di comporta¬ 
mento per l’intera superficie di controllo 
e li uniamo tra loro, essi formeranno 
una superficie continua: la superficie di 
comportamento. La superficie presenta 
nel suo complesso una pendenza, dai va¬ 
lori alti, dove è predominante la collera, 
fino ai valori bassi nella regione in cui lo 
stato prevalente è la paura; ma la pen¬ 
denza non è la caratteristica più tipica 
della superficie. La teoria delle catastro¬ 
fi rivela che al centro della superficie 
deve esserci una piega doppia e conti¬ 
nua, che dà luogo a una rientranza senza 
grinze verso la parte posteriore della su¬ 
perficie che alla fine scompare in un 
punto in cui i tre piani della piega si 
fondono (si veda l’illustrazione della pa¬ 
gina precedente). È la piega che conferi¬ 
sce a questo modello le sue caratteristiche 
più interessanti. Ciascun punto della su¬ 
perficie di comportamento rappresenta il 
comportamento più probabile del cane, 
con l’eccezione di quelli che vengono a 
cadere nel mezzo della piega, che rappre¬ 
sentano il comportamento meno proba¬ 
bile. Con la teoria delle catastrofi possia¬ 
mo ricavare la forma dell’intera superfi¬ 
cie dal fatto che il comportamento è bi¬ 
modale per alcuni dei punti di controllo. 

Per comprendere come questo model¬ 
lo può prevedere il comportamento, dob¬ 
biamo considerare la reazione del cane a 
degli stimoli che cambiano. Supponiamo 
che la condizione emozionale del cane 
sia di neutralità e che possa essere rap¬ 
presentata da un punto all’origine della 
superficie di controllo. Il comportamen¬ 
to del cane, dato dal punto corrispon¬ 
dente sulla superficie di comportamento, 
è anch’esso di neutralità. Se in seguito 
alcuni stimoli fanno crescere l’ira del 
cane senza influenzarne la paura, il com¬ 
portamento cambia gradualmente, spo¬ 
standosi sulla superficie di comporta¬ 
mento a quote superiori, verso posizioni 
di maggiore aggressività; se la collera è 
aumentata abbastanza, il cane attacca. 
Se ora la paura del cane comincia ad au¬ 
mentare mentre la collera rimane a un 
livello elevato, il punto che rappresenta 
lo stato emozionale sulla superficie di 
controllo si sposterà verso il centro del 
grafico. Il punto che rappresenta il com¬ 
portamento deve evidentemente seguirlo, 
ma poiché la pendenza della superficie 
di comportamento in questa regione non 
è accentuata, il comportamento cambia 
soltanto leggermente, e il cane continua 
a essere aggressivo. Man mano che la 
paura continua a crescere, però, il punto 
del comportamento raggiunge infine il 
bordo della piega. E qui si evidenziano le 
originali e illuminanti proprietà di que- 
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sto modello. Al bordo della piega il pia¬ 
no lungo il quale si è spostato il punto 
del comportamento si piega alFingiù, e 
viene perciò ad annullarsi; con un ulte¬ 
riore aumento della paura, la superficie 
scompare. La situazione comportamen¬ 
tale deve perciò cadere perpendicolar¬ 
mente sulla superficie inferiore del grafi¬ 
co, che rappresenta modi di comportarsi 
assai diversi. Gli stati aggressivi del pia¬ 
no superiore non sono più possibili: si 
verifica un cambiamento improvviso, an¬ 
zi catastrofico, un atteggiamento più mi¬ 
te. Il modello dunque prevede che se un 
cane adirato si impaurisce progressiva¬ 
mente, alla fine interromperà il suo at¬ 
tacco e si ritirerà. Il cambiamento im¬ 
provviso del comportamento potrebbe 
essere chiamato una catastrofe di fuga. 
Il grafico permette inoltre di individuare 
un modello opposto di comportamento: 
una catastrofe di attacco. In uno stato 
iniziale dominato dalla paura il compor¬ 
tamento del cane permane stabilmente 
sul piano inferiore, ma in seguito a un 
adeguato aumento di collera passa dalla 
parte opposta della piega saltando di 
colpo al piano superiore, corrispondente 
a uno stato emozionale più aggressivo. 


In altre parole, un cane spaventato, mes¬ 
so in una situazione in cui la rabbia au¬ 
menta costantemente, può attaccare im¬ 
provvisamente. 

Consideriamo infine il comportamento 
di un cane, il cui umore iniziale è di 
neutralità, quando la collera e la paura 
aumentano contemporaneamente. Il pun¬ 
to di comportamento si trova all’inizio 
nell’origine, e sotto l’influenza di stimoli 
in conflitto tra loro si sposta su una linea 
retta verso la parte anteriore del grafico. 
Arrivato però alla singolarità che la su¬ 
perficie presenta dove inizia a piegarsi, il 
punto si deve spostare sul piano supe¬ 
riore quando il cane diventa più aggres¬ 
sivo o sul piano inferiore quando il cane 
diventa meno aggressivo. Il piano che 
viene scelto dipende in modo critico dal¬ 
l’umore appena prima che raggiunga la 
singolarità. Il grafico è detto divergente: 
un cambiamento lieve nelle condizioni 
iniziali dà luogo, nella condizione finale, 
a un cambiamento molto rilevante. 

La catastrofe a cuspide 

La linea che segna i bordi della piega 
nella superficie di comportamento, dove 


il piano superiore e il piano inferiore sì 
flettono per formare il piano intermedio, 
è chiamata curva di piegatura, Proiettata 
sulla superficie di controllo, dà luogo a 
una curva a forma di cuspide; per questo 
il modello è chiamato catastrofe a cuspi¬ 
de. È una delle più semplici catastrofi 
elementari, e si è dimostrata di gran lun¬ 
ga la più utilizzabile. La cuspide sulla 
superficie di controllo è detta insieme di 
biforcazione della catastrofe a cuspide e 
definisce le soglie entro cui si verificano i 
cambiamenti improvvisi. Fino a che lo 
stato del sistema si mantiene all’esterno 
della cuspide, il comportamento varia in 
maniera graduale e continua in funzione 
dei parametri di controllo. Anche sulla 
soglia della cuspide non si osserva nessun 
cambiamento brusco. Quando il punto 
di controllo continua il percorso attra¬ 
versando la cuspide, è inevitabile una 
catastrofe. 

In ogni punto all’interno della bifor¬ 
cazione ci sono due possibili modi di 
comportarsi; al di fuori di essa, c’è sol¬ 
tanto un modo possibile. E ancora, ci 
sono all’interno della cuspide solo due 
modi di comportamento, anche se nel 
punto corrispondente la superficie di 



La macchina della catastrofe ideata dall’autore presenta un comporta¬ 
mento discontinuo che può essere descritto per mezzo di una catastro¬ 
fe a cuspide. La macchina consiste in un disco di cartone fissato con 
un perno nel centro, con due strisce di gomma fissate in un punto 
vicino al perimetro. La lunghezza di ogni striscia, non sottoposta a 
tensione, è approssimativamente uguale al diametro del disco. L’estre¬ 
mità libera di una delle strisce è fissata a lato deH’appareechiatura, e 
la macchina si mette in funzione spostando l’altra striscia di gomma, 
l’estremità libera della quale è detta punto di controllo. Il comporta¬ 
mento misurato è l'angolo formato dal punto fisso, dal perno e dal 
punto in cui le due strisce sono fissate al disco. Molti spostamenti del 


punto di controllo provocano solo delle leggere rotazioni del disco, 
ma in certi casi il disco scatta improvvisamente da un lato all’altro. Se 
si segnano tutte le posizioni del punto di controllo in cui avvengono 
questi movimenti improvvisi, ne risulta una curva a forma di diaman¬ 
te. La curva consta di quattro cuspidi, ciascuna delle quali forma 
l’insieme di biforcazione di una catastrofe a cuspide. Spostando il 
punto di controllo lungo la traiettoria in colore, nella posizione A non 
si verifica nessun movimento, e il disco gira di colpo fino a portarsi 
nella posizione B. Se il percorso del punto di controllo è rovesciato, 
esso attraversa B senza che si verifichi nessun movimento, mentre il 
disco si sposta quando il punto di controllo raggiunge la posizione A. 



Una funzione dell’energia regola il comportamento della macchina 
della catastrofe. La macchina tende sempre ad assumere una posizio¬ 
ne di energia minima, vale a dire, il disco ruota fino a rendere minima 
la tensione delle strisce di gomma. Quando il punto di controllo si 
trova al di fuori dell'insieme di biforcazione, esiste una sola posizione 
di energia minima, che corrisponde all’unica posizione stabile del 
disco. Quando il punto di controllo viene spostato attraverso l’insieme 


di biforcazione, in A si sviluppa un secondo minimo locale di energia 
che alla fine diventa più profondo del primo. La macchina tuttavia 
non può raggiungere il nuovo minimo locale, perché ne è separata da 
un massimo locale. Soltanto quando il punto di controllo attraversa la 
seconda linea della cuspide in B il massimo locale viene eliminato; a 
questo punto l’equilibrio si spezza c la macchina si sposta in modo 
improvviso nella nuova posizione caratterizzata da energia minima. 
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Il modello a cuspide della macchina della catastrofe dà luogo a una superficie di comportamen¬ 
to piegata, su una parte dell’insieme di biforcazione, esattamente come la cuspide più vicina al 
disco. Ogni punto del piano superiore della superficie di comportamento dà la posizione del 
disco che ha il minimo di energia per quella posizione del punto di controllo. All’interno dell’in¬ 
sieme di biforcazione, dove sono due le posizioni stabili del disco, ci sono due minimi locali, 
uno collocato sul piano superiore e uno sul piano inferiore. Il piano intermedio rappresenta in¬ 
vece il massimo locale nella funzione dell’energia. I cambiamenti catastrofici subiti dalla posizio¬ 
ne angolare si verificano ogni volta che il punto di controllo attraversa completamente la cuspide. 


comportamento presenta tre piani. Ciò 
in quanto il piano che si trova nella re¬ 
gione centrale della piega è formato da 
punti che rappresentano il comportamen¬ 
to meno probabile. Il piano intermedio è 
inserito nel grafico soprattutto affinché 
la superficie di comportamento risulti 
omogenea e continua; il punto di com¬ 
portamento non occupa mai il piano in¬ 
termedio. Anzi, non esiste alcun percor¬ 
so sulla superficie di controllo, che po¬ 
trebbe condurre il punto di comporta¬ 
mento sul piano intermedio. Ogniqual¬ 
volta la curva di piegatura viene attra¬ 
versata, il punto «salta» dal piano supe¬ 
riore al piano inferiore, e viceversa. 

La costruzione di questo modello si 
basava in un primo tempo su un’ipotesi 
sostanzialmente deterministica: che il 
comportamento del cane avrebbe potuto 
essere previsto dal suo umore così co¬ 
me veniva esternato dall’atteggiamento 
del muso. La bimodalità del grafico che 
ne risulta potrebbe sembrare in un primo 
tempo un elemento in grado di minare 
questa ipotesi, poiché l’esistenza di due 
possibili maniere di comportarsi per uno 
stato emozionale dato rende impossibile 
una previsione univoca. Effettivamente 
se conosciamo soltanto lo stato emozio¬ 
nale attuale (e se questo stato viene a 
cadere all’interno della regione bimodale 
del grafico) non possiamo prevedere che 
cosa farà il cane. Tuttavia se consideria¬ 


mo un altro fattore nel momento in cui 
facciamo delle previsioni, il determini¬ 
smo di questo modello viene rinforzato, 
rendendo contemporaneamente il model¬ 
lo più complesso e sofisticato. Il com¬ 
portamento del cane può essere previsto 
se noi conosciamo, oltre al suo stato 
emozionale attuale, anche la storia re¬ 
cente delle sue emozioni. Non sarebbe 
sorprendente che gli effetti ottenuti spa¬ 
ventando un cane adirato siano diversi 
da quelli ottenuti facendo adirare un ca¬ 
ne spaventato. 

Modelli di comportamento umano 

La catastrofe a cuspide fornisce anche 
un’interpretazione di certi tipi di com¬ 
portamento umano. Per esempio, una 
discussione spesso comporta la manife¬ 
stazione di aggressività, e il suo sviluppo 
è fortemente determinato dalla collera e 
dalla paura. Si può costruire una cata¬ 
strofe a cuspide prendendo questi stati 
emozionali come parametri di controllo, 
considerando l’intensità del conflitto co¬ 
me asse del comportamento. 

All’inizio, sulla superficie di compor¬ 
tamento si trova il comportamento più 
neutrale: la discussione razionale. Con 
l’aumento della collera e della paura, il 
punto di comportamento si sposta in 
avanti sul grafico, verso quella parte di 
superficie che è piegata, dove il compor¬ 


tamento è bimodale. I contendenti ve¬ 
dono chiudersi la possibilità di condurre 
un discorso equilibrato, e sono costretti 
o a fare asserzioni sempre più recise, o a 
fare concessioni. Con un aumento ul¬ 
teriore di emotività, le scelte di compor¬ 
tamento possibili divergono ulteriormen¬ 
te, e le alternative sono l’invettiva o le 
scuse; alla fine gli avversari devono sce¬ 
gliere tra la sfuriata e le lacrime. Una 
volta che la discussione è divenuta calda, 
un leggero aumento sia di collera che di 
paura può causare un cambiamento su¬ 
bitaneo nel comportamento. Chi sostiene 
con aggressività una tesi, quando comin¬ 
cia a oscillare nella sua sicurezza, può 
abbandonare la posizione e cominciare a 
scusarsi; un oppositore timido, costretto 
a fare ripetute concessioni può improv¬ 
visamente perdere la calma e diventare 
furibondo. Il modello suggerisce anche 
una strategia per una persuasione effica¬ 
ce. Se è probabile che una discussione 
sollevi sia collera sia paura, allora è mol¬ 
to meglio esporre i fatti senza cercare di 
imporre subito il proprio punto di vista, 
lasciando sbollire le emozioni e mettendo 
in grado l’avversario di riguadagnare la 
via del pensiero razionale. 

Un altro schema di comportamento 
umano che può essere descritto dal mo¬ 
dello a cuspide è l’autocommiserazione e 
la catarsi che a volte interviene ad alle¬ 
viarla. In questo caso i parametri di con¬ 
trollo, analoghi alla collera e alla paura, 
sono le emozioni meno violente della 
frustrazione e dell’ansia. E ancora, l’asse 
del comportamento non misura un com¬ 
portamento manifesto, che è negli ani¬ 
mali l’unico che può essere osservato, 
ma gli umori sottostanti che nell’uomo 
possono essere identificati direttamente. 
Una tipica serie di stati d’animo potreb¬ 
be andare dalla collera alla noia, attra¬ 
verso stati d’animo di neutralità, arri¬ 
vando fino all’abbattimento e all’auto¬ 
commiserazione. 

Nel modello, un aumento notevole del¬ 
l’ansia provoca uno stato d’animo persi¬ 
stente di autocommiserazione; il punto 
che rappresenta lo stato d’animo finisce 
nel piano inferiore della superficie di 
comportamento piegata (si veda l’illu¬ 
strazione in alto a pagina 164). L’auto¬ 
commiserazione è un atteggiamento di¬ 
fensivo adottato assai frequentemente 
dai bambini e sembra spesso che un at¬ 
teggiamento di solidarietà e di compren¬ 
sione risulti inefficace ad attenuarla. Ep¬ 
pure una battuta spiritosa può provocare 
una subitanea diminuzione della collera 
e liberando la tensione può aprire la pos¬ 
sibilità di un ritorno a uno stato meno 
dominato dall’emozione. È spiacevole 
che sia l’ironia ad aver successo e la com¬ 
prensione a fallire, ma la causa di ciò 
appare chiara nel modello. Il sarcasmo 
porta a un aumento della frustrazione, e 
il risultato è che il punto che rappresenta 
lo stato d’animo attraversa la superficie 
di comportamento fino alla curva di pie¬ 
gatura; dopo aver raggiunto l’estremità 
del piano inferiore, non può che compie¬ 
re un salto catastrofico fino al piano 
superiore, e l’autocommiserazione si tra¬ 
sforma in collera. 
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Questi esempi della catastrofe a cuspi¬ 
de offrono un modello interessante e ap¬ 
parentemente efficace di certe modalità 
di comportamento animale e umano, ma 
si tratta solo di un modello fenomenolo¬ 
gico; non si può ancora dire che sia in 
grado di spiegare il comportamento. Il 
problema della motivazione per cui un 
cane fa quello che fa non è stato risol¬ 
to ma semplicemente spostato a un livel¬ 
lo di maggiore astrazione. Dobbiamo ora 
chiederci perché il modello funziona. In 
particolare, perché il punto del compor¬ 
tamento si muove sulla superficie fino al 
bordo di una piega, e poi compie un 
balzo catastrofico in un altro piano? Per¬ 
ché non passa gradualmente da una su¬ 
perficie all’altra, in modo che si verifichi 
una transizione continua? Qual è il mec¬ 
canismo che regola lo stato del sistema 
sulla superficie di comportamento? La 
risposta a queste domande può essere 
ottenuta per mezzo di un altro esempio 
di catastrofe a cuspide, esempio che ri¬ 
guarda il comportamento di un sistema 
assai più semplice di quello di un cane o 
di un uomo. 

Una macchina della catastrofe 

È possibile generare artificialmente ca¬ 
tastrofi elementari per mezzo di un sem¬ 
plice dispositivo composto da un carton¬ 
cino rigido, strisce di gomma e pochi 
altri oggetti. La parte principale della 
macchina consiste in un disco di carton¬ 
cino con un perno al centro, e di due 
strisce di gomma attaccate in un punto 
vicino al perimetro. Il capo libero di una 
delle due strisce è fissato a un punto che 
si trova al di fuori del disco; l’altra 
striscia di gomma serve a controllare i 
movimenti del disco, e si indica la posi¬ 
zione del suo capo libero come il punto 
di controllo (si veda l’illustrazione in 
alto a pagina 161). La macchina della ca¬ 
tastrofe si mette in moto spostando il 
punto di controllo nel piano del disco. In 
molti casi il risultato è una leggera rota¬ 
zione del disco; tuttavia, in una regione, 
prossima al punto diametralmente oppo¬ 
sto al punto in cui è agganciata la striscia 
fissa, un leggero movimento del punto di 
controllo può provocare un movimento 
improvviso del disco. Segnando la posi¬ 
zione del punto di controllo ogni volta 
che il disco scatta, ne risulta una curva 
concava, a forma di diamante. Questa 
curva è formata da quattro cuspidi con¬ 
nesse, gli insiemi di biforcazione di quat¬ 
tro catastrofi a cuspide. 

Se consideriamo solo una di queste 
quattro cuspidi, quella più vicina al di¬ 
sco, possiamo costruire la corrisponden¬ 
te superficie di comportamento sisteman¬ 
do la curva di piegatura in modo che 
venga a trovarsi proprio sopra la cuspi¬ 
de. Per ogni posizione del punto di con¬ 
trollo al di fuori della cuspide, la super¬ 
ficie di comportamento ha un solo piano 
e il disco ha una sola posizione stabile. 
Se il punto di controllo si trova all’inter¬ 
no della cuspide, la superficie del com¬ 
portamento ha tre piani, ma il piano di 
mezzo deve essere escluso perché corri¬ 
sponde a un equilibrio instabile. Come 


risultato, dunque, ci sono due posizioni 
stabili del disco. Il fatto che il comporta¬ 
mento della macchina risponda a questo 
modello può essere verificato spostando 
il punto di controllo attraverso il grafico 
da destra a sinistra. Il disco si muove 
lievemente e solo in misura trascurabile 
fino a quando il punto di controllo tocca 
il bordo di destra della cuspide; il disco 
gira poi di colpo non appena il punto di 
comportamento cade al di fuori dell’e¬ 
stremità del piano inferiore e balza su 
quello superiore. Quando il percorso del 
punto di controllo va in senso contrario, 
il punto attraversa il bordo destro della 
cuspide senza che si verifichi l’evento, e 
il disco continua a muoversi lievemente 
fino a che il punto raggiunge il bordo 
sinistro della cuspide; qui, il punto di 
comportamento salta dal piano superiore 
a quello inferiore. 

È facile, nel caso della macchina della 
catastrofe, individuare la causa di questo 
comportamento: si tratta della tendenza 
di ogni sistema fisico in cui l’attrito è ri¬ 
levante a raggiungere uno stato di ener¬ 
gia minima. L’energia da ridurre al mi¬ 
nimo è l’energia potenziale situata nelle 
strisce di gomma, e infatti il disco ruota 
fino a quando la tensione sulle due fasce 
non è al minimo. In questa posizione, la 
macchina è in equilibrio stabile. A meno 
che si aggiunga energia al sistema, la 
macchina rimane in uno stato di equili¬ 
brio. Il processo che la conduce a quel 
punto è detto «dinamica». 

Il funzionamento della dinamica può 
esere dimostrato con una serie di grafici, 
ciascuno dei quali mostra per ogni singo¬ 
la posizione del punto di controllo l’e¬ 
nergia della macchina per tutte le possi¬ 
bili rotazioni del disco (si veda l’illustra¬ 


zione in basso a pagina 161). Fino a che il 
punto di controllo resta al di fuori della 
cuspide, il grafico consiste in una curva 
continua con una sola depressione, o 
minimo, e lo stato della macchina si spo¬ 
sterà rapidamente alla condizione di e- 
nergia minima nella parte più bassa della 
depressione. Non appena il punto di con¬ 
trollo cade all’interno della cuspide, si 
sviluppa, vicino alla prima, una seconda 
depressione, che rappresenta l’energia 
minima locale. Questa seconda depres¬ 
sione diviene sempre più profonda, ma 
la macchina non può entrare nello stato 
corrispondente a essa poiché le due de¬ 
pressioni sono separate da un picco, che 
rappresenta un massimo locale dell’ener¬ 
gia. Lo stato della macchina non cambia 
fino a che la seconda depressione non si 
unisce al valore massimo locale. Ciò av¬ 
viene quando il punto di controllo oltre¬ 
passa la seconda linea della cuspide, e lo 
stato della macchina di conseguenza vie¬ 
ne portato di colpo dalla dinamica in una 
nuova e unica posizione di energia mini¬ 
ma. Si chiarisce allora il significato della 
dinamica nel momento in cui si scopre 
che la superficie di comportamento della 
catastrofe a cuspide è il grafico di tutti i 
minimi e di tutti i massimi della funzione 
dell’energia. Al di fuori della cuspide 
esiste un solo minimo di energia, e non 
esistono massimi; la superficie di com¬ 
portamento perciò presenta un solo pia¬ 
no. In corrispondenza della cuspide si 
formano un nuovo minimo e un nuovo 
massimo locale e di conseguenza si for¬ 
mano due nuovi piani sulla superficie di 
comportamento. Lo stato della macchi¬ 
na non può mai rimanere stabile nel 
piano intermedio poiché tale posizione 
corrisponde al massimo di energia. 



Cinque proprietà caratterizzano i fenomeni che possono essere descritti per mezzo di una 
catastrofe a cuspide, li comportamento è sempre bimodale in qualche parte del dominio e si 
osservano sbalzi improvvisi tra un modo di comportarsi e l’altro. Il salto dal piano superiore al 
piano inferiore della superficie di comportamento non avviene nella stessa posizione in cui 
avviene il salto dal piano inferiore a quello superiore, e questo effetto è chiamato isteresi. Tra il 
piano superiore e quello inferiore esiste una zona inaccessibile sull’asse di comportamento; il 
piano intermedio, che rappresenta il comportamento meno probabile, è stato omesso per mag¬ 
giore chiarezza. La catastrofe a cuspide implica la possibilità di un comportamento divergente. 
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La liberazione catartica dall'autocommiserazione è descritta per mezzo di una catastrofe a 
cuspide in cui l’ansia e la frustrazione sono i fattori in conflitto che influenzano lo stato 
d’animo. L’autocommiserazione viene indotta da un aumento di ansietà; vi si può porre fine 
con una battuta ironica, che provoca un aumento di frustrazione. Non appena il punto di 
controllo attraversa la cuspide, lo stato d’animo cambia in maniera catastrofica passando alla 
collera; l’abbassamento della tensione che ne segue riapre la via a stati emozionali più sereni. 



Il comportamento del mercato finanziario viene descritto da un modello in cui i parametri di 
controllo sono una domanda superiore all’offerta e il rapporto tra il mercato controllato dagli 
speculatori e quello controllato da chi investe a lungo termine. Il comportamento stesso viene 
misurato dal tasso con cui l’indice dei prezzi sale o scende. I fattori di controllo sono orientati 
nel grafico non come fattori in conflitto, ma come fattore normale e fattore di biforcazione. Una 
caduta dal piano superiore a quello inferiore rappresenta un crollo finanziario; il lento recupero 
ha luogo per effetto della retroazione dell’indice del prezzo sui parametri di controllo. 


Il procedimento matematico per deli¬ 
neare la superficie di comportamento è 
un problema di analisi elementare: la su¬ 
perficie di comportamento è un grafico 
comprendente tutti i punti in cui la deri¬ 
vata prima della funzione dell’energia è 
uguale a zero. Non è indispensabile com¬ 
prendere come si effettua questa opera¬ 
zione: è sufficiente sapere che la derivata 
prima è uguale a zero in ogni parte del 
grafico in cui la funzione dell’energia è 
orizzontale (dove la sua pendenza è u- 
guale a zero). La funzione è orizzontale 
solo ai minimi e ai massimi e ai punti di 
flessione. I minimi danno luogo ai piani 
stabili, quello superiore e quello inferio¬ 
re, i massimi danno luogo al piano inter¬ 
medio, instabile, e i punti di flessione 
danno luogo alla curva di piegatura che 
segna i confini dei piani. 

Il comportamento associato alla cuspi¬ 
de più lontana dal disco potrebbe essere 
analizzato nello stesso modo con cui ab¬ 
biamo descritto la cuspide più vicina. Le 
due cuspidi laterali, tuttavia, differisco¬ 
no per un aspetto fondamentale: la loro 
funzione dell’energia è rovesciata, in mo¬ 
do che all’interno della cuspide ci sono 
due punti - che corrispondono a due 
posizioni del disco - con massimo di 
energia e solo un punto con minimo di 
energia. La dinamica fa restare la macchi¬ 
na nell’unica posizione stabile di energia 
minima. Anche sulla superficie di com¬ 
portamento la posizione dei minimi e dei 
massimi si trova rovesciata: il piano in¬ 
termedio rappresenta minimi stabili di 
energia, il piano superiore e quello infe¬ 
riore rappresentano massimi instabili. Il 
punto di comportamento perciò può tro¬ 
varsi soltanto sul piano intermedio. Il 
grafico è chiamato catastrofe a cuspide 
duale. 

Il ruolo della «dinamica» 

Ora è possibile spiegare il successo del¬ 
la teoria della catastrofe nel rendere con¬ 
to del comportamento della macchina 
delle catastrofi. Il concetto centrale è 
quello di dinamica, che ha due funzio¬ 
ni. Primo, tiene fermo il punto di com¬ 
portamento sul piano superiore o sul 
piano inferiore della superficie di com¬ 
portamento. Se si gira a mano il disco in 
senso contrario a quello della tensione 
delle strisce di gomma, e poi lo si lascia 
andare, la dinamica lo riporta subito in¬ 
dietro, nella posizione di equilibrio, vale 
a dire, riporta il punto di comportamen¬ 
to sulla superficie di comportamento. Se¬ 
condo, quando il punto di comportamen¬ 
to attraversa la curva di piegatura, è la 
dinamica che provoca il salto catastrofi- 
co da un piano all’altro. 

Gli stessi principi possono essere ap¬ 
plicati ai modelli psicologici considerati 
più sopra. Le funzioni di probabilità in 
quei modelli sono analoghe alla funzione 
dell’energia nella macchina della cata¬ 
strofe, con la sola eccezione del fatto che 
le posizioni dei minimi e dei massimi 
sono ribaltate. Il piano superiore e quel¬ 
lo inferiore della superficie di compor¬ 
tamento sono formati da tutti i punti che 
rappresentano la massima probabilità e 
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La fase di transizione dallo stato liquido della materia a quello gassoso è rispecchiata in un 
modello a cuspide in cui i fattori di controllo sono la temperatura e la pressione. In condizioni 
normali, ebollizione e condensazione si verificano, agli stessi valori di temperatura e pressione, 
quindi si hanno cambiamenti catastrofici, ma non isteresi. In circostanze speciali, tuttavia, il 
vapore può venire raffreddato al di sotto del punto di condensazione, e un liquido può essere 
riscaldato al di sopra del suo punto di ebollizione, così che si segue la superficie del comporta¬ 
mento per lutto il percorso fino alla curva di piegatura. Il punto critico, in cui il liquido e il gas 
esistono contemporaneamente, è rappresentato dalla singolarità in cui la piega scompare. 


il piano intermedio è formato da tutti 
quelli che rappresentano il minimo della 
probabilità. Resta una domanda impor¬ 
tante: in che cosa consiste la dinamica? 
Nel modello dell’aggressione che cosa 
spinge il cane a manifestare il comporta¬ 
mento più probabile, e nel modello del¬ 
l’autocommiserazione perché è proprio 

10 stato d’animo «più probabile» quello 
che viene adottato? 

Un minimo di energia in un sistema 
fisico come quello della macchina della 
catastrofe è un esempio speciale di un 
concetto chiamato «attrattore». In que¬ 
sto caso si tratta del tipo più semplice di 
attrattore, uno stato unico e stabile, e il 
suo effetto è simile a quello di un ma¬ 
gnete: ogni cosa nel suo raggio di in¬ 
fluenza è trascinata verso di esso. Sotto 
l’influenza dell’attrattore il sistema assu¬ 
me uno stato di equilibrio stabile. Anche 
nei modelli psicologici devono esistere 
degli attrattori, anche se non è detto che 
debbano essere semplici come questo. 
L’attrattore di un sistema che sia in equi¬ 
librio dinamico consiste nell’intero ciclo 
stabile degli stati attraverso i quali passa 

11 sistema. Per esempio una corda di vio¬ 
lino strofinata dall’archetto ripete lo stes¬ 
so ciclo di posizioni più e più volte, alla 
propria frequenza di risonanza, e questo 
ciclo di posizioni rappresenta un attrat¬ 
tore per la corda strofinata. 

Nei modelli psicologici, l’ovvia sede in 
cui ricercare gli attrattori è il funziona¬ 
mento neurologico del cervello. Eviden¬ 
temente il cervello è di gran lunga più 
complicato e misterioso che non una cor¬ 
da di violino, ma si sa che i miliardi di 
neuroni che lo compongono sono orga¬ 
nizzati in vaste reti interconnesse che 
formano un sistema dinamico; gli stati di 
equilibrio di ogni sistema dinamico pos¬ 
sono essere rappresentati come degli at¬ 
trattori. Alcuni di questi attrattori pos¬ 
sono consistere in singoli stati, ma altri 
sono più simili a cicli stabili di stati o ad 
analoghi in dimensioni superiori di cicli 
stabili. Poiché le varie parti del cervello 
si influenzano a vicenda, gli attrattori 
compaiono e scompaiono, in certi casi 
rapidamente, in altri più gradualmente. 
Non appena un attrattore lascia il posto 
a un altro, la stabilità del sistema può 
essere conservata; ma spesso ciò non ac¬ 
cade; allora si verifica un salto catastro¬ 
fico nello stato del cervello. 

La teoria di Thom stabilisce che tutti i 
possibili sbalzi improvvisi tra gli attrat¬ 
tori più semplici - i punti di equilibrio 
stabile - sono determinati dalle catastrofi 
elementari. Quindi se la dinamica del 
cervello avesse solo questo tipo di attrat¬ 
tori, si potrebbero verificare solo cata¬ 
strofi elementari. Ma non è così; un’in¬ 
dicazione ovvia dell’esistenza di attratto- 
ri più complessi è il ritmo alfa delle onde 
cerebrali: un attrattore ciclico. Non si 
conoscono ancora le regole che control¬ 
lano gli sbalzi tra gli attrattori ciclici e 
quelli di dimensioni superiori; è probabi¬ 
le che comprendano non solo catastrofi 
elementari, ma anche catastrofi genera¬ 
lizzate, e il loro studio costituisce oggi 
un’area assai attiva di ricerca matemati¬ 
ca. Non esiste oggi una teoria soddisfa¬ 


cente che descriva tutte le dinamiche del 
cervello, tuttavia le catastrofi elementari 
forniscono dei modelli significativi di al¬ 
cune attività cerebrali. I modelli sono 
espliciti e a vòlte di una semplicità cri¬ 
stallina, ma la potenza della teoria mate¬ 
matica che sta alla loro base rende ragio¬ 
ne della complessità delle reti nervose 
sottostanti. 

Il concetto di attrattore nella dinamica 
del cervello fornisce ciò che occorre nei 
nostri modelli di comportamento umano 
e animale. Non si conosce bene quale sia 
il meccanismo responsabile di uno stato 
d’animo come l’autocommiserazione, ma 
resistenza di questo stato d’animo come 
stato stabile implica che quel meccani¬ 
smo è un attrattore. Nel modello dell’au¬ 
tocommiserazione ogni punto della su¬ 
perficie di comportamento corrisponde a 
un attrattore per il sistema del cervello 
che determina questo stato d’animo. Se 
quel sistema neurologico viene in qual¬ 
che modo disturbato, esso torna rapida¬ 
mente, sotto l’influenza di un attrattore, 
alla superficie di comportamento, pro¬ 
prio come la macchina della catastrofe 
ritorna nel suo stato di equilibrio. Ci si 
imbatte in cambiamenti bruschi di umo¬ 
re quando si interrompe la stabilità di un 
attrattore, permettendo al sistema deter¬ 
minante lo stato d’animo di cadere sotto 
l’influenza di un altro attrattore, verso il 
quale esso si sposta immediatamente. 


Attraverso questo meccanismo ipoteti¬ 
co la teoria delle catastrofi non solo for¬ 
nisce un modello del comportamento ma¬ 
nifestato, ma anche dell’attività cerebra¬ 
le che lo produce. È probabile che il 
modello si adatti meglio alle regioni più 
primitive del cervello, come il mesence¬ 
falo, dove le reti nervose hanno un alto 
grado di integrazione e quindi possono 
agire come un tutto unico. Nella parte 
filogeneticamente più recente, la cortec¬ 
cia cerebrale, gli schemi di attività sono 
assai più complessi. I modelli psicologici 
che abbiamo considerato riguardano so¬ 
prattutto l’emozione e lo stato d’animo, 
e si ritiene che la regolazione degli stati 
emozionali sia dovuta soprattutto alla 
parte del mesencefalo detta sistema lim- 
bico. 

Caratteristiche della catastrofe a cuspide 

L’analisi degli esempi precedenti fa 
pensare che sono molti gli elementi co¬ 
muni a tutte le catastrofi a cuspide. Una 
caratteristica costante è che il comporta¬ 
mento è bimodale su una parte del domi¬ 
nio e che si osservano cambiamenti im¬ 
provvisi nel passaggio da un modo di 
comportarsi all’altro. Inoltre, il cambia¬ 
mento improvviso presenta costantemen¬ 
te l’effetto chiamato isteresi, e cioè la 
transizione dal piano superiore a quello 
inferiore non avviene nello stesso punto 
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CATASTROFE 

DIMENSIONI 

DI CONTROLLO 

DIMENSIONI DI 
COMPORTAMENTO 

FUNZIONE 

DERIVATA PRIMA 

CUSPIDI 

_, 

PIEGA 

1 

1 

1 1 

— x 3 - ax 

x 2 - a 

CUSPIDE 

2 

1 

-|x 4 - ax --ì-bx 2 

4 2 

x 3 - a - bx 

CODA DI RONDINE 

3 

1 

x 5 - ax- -1 bx 2 - -1 ex 3 

x 4 - a - bx - ex 2 

FARFALLA 

4 

1 

i x 6 - ax -1 bx 2 - -ì ex 3 - 1 dx 4 
b dà 4 

x 5 - a - bx - ex 2 - dx 3 

OMBELICHI 

IPERBOLICO 

3 

2 

x 3 + y 3 + ax + by + cxy 

3x 2 + a + cy 

3y z + b + ex 

ELLITTICO 

3 

2 

x 3 - xy 2 + ax + by + ex 2 + cy 2 

3x 2 - y 2 + a + 2cx 
-2xy + b + 2cy 

PARABOLICO 

4 

2 

x 2 y + y 4 + ax + by + ex 2 + dy 2 

2xy + a + 2cx 
x 2 + 4y 3 + b + 2dy 


Sette catastrofi elementari descrivono tutte le possibili discontinuità 
nei fenomeni controllati da non più di quattro fattori. Ciascuna delle 
catastrofi è associata a una funzione in cui i parametri di controllo 
sono rappresentati come coefficienti (a, b, c, d) e il comportamento 


del sistema è determinato dalle variabili ( x , In ogni modello di 

catastrofe, la superficie di comportamento è il grafico di tutti i punti 
in cui la derivata prima di questa funzione è uguale a zero o, se vi 
sono due derivale prime, i punti in cui sono entrambe uguali a zero. 


in cui avviene quella dal piano inferiore 
a quello superiore. Il cambiamento im¬ 
provviso non avviene nel mezzo della cu¬ 
spide, bensì solo quando viene raggiunto 
Pinsieme di biforcazione. Un’altra carat¬ 
teristica è che all’interno della cuspide, 
dove il comportamento si fa bimodale, 
la zona centrale sull’asse del comporta¬ 
mento diventa inaccessibile. Infine, il 
modello implica la possibilità di una di¬ 
vergenza, in modo che una leggera per¬ 


turbazione nello stato iniziale del sistema 
può avere come conseguenza una diffe¬ 
renza assai rilevante nello stato finale. 
Queste cinque qualità - bimodalità, tran¬ 
sizioni improvvise, isteresi, inaccessibili¬ 
tà e divergenza - sono correlate tra loro 
dal modello stesso. Se una qualsiasi di 
queste qualità si evidenzia in un proces¬ 
so, bisognerebbe ricercare le altre quat¬ 
tro, e se se ne trova più di una, allora il 
processo dovrebbe essere considerato 


passibile di una descrizione per mezzo 
della catastrofe a cuspide. 

Un processo in cui possono essere in¬ 
dividuate le cinque qualità è quello dello 
sviluppo delle ostilità tra nazioni, situa¬ 
zione che presenta delle ovvie analogie 
con i modelli del litigio e della aggressio¬ 
ne. In quei modelli i parametri erano la 
collera e la paura; qui vi sostituiamo la 
minaccia e il costo. L’asse del comporta¬ 
mento descrive le azioni possibili della 




OMBELICO ELLITTICO 



I grafici di cinque catastrofi elementari chiariscono le loro possibilità 
geometriche. La catastrofe a piega è una sezione trasversale di una curva 
di piegatura della catastrofe a cuspide, e il suo insieme di biforcazione 
consiste di un solo punto. La catastrofe a cuspide è tra le catastrofi 


disegnabili quella di ordine massimo. La coda di rondine è a quattro 
dimensioni e l’ombelico iperbolico e l’ombelico ellittico sono a cinque 
dimensioni. Per queste è possibile disegnare solo gli insiemi di bifor¬ 
cazione a tre dimensioni; le superfici di comportamento non compaiono. 
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Le sezioni sono runico espediente che permette di rappresentare graficamente le ultime dui- 
catastrofi, poiché anche i loro insiemi di biforcazione hanno più di tre dimensioni. L’insieme di 
biforcazione a quattro dimensioni della catastrofe a farfalla è mostrato in sezioni a tre 
dimensioni; la quarta dimensione è il fattore farfalla, e se è il tempo, una configurazione si 
trasforma nell’altra. Il movimento da sinistra a destra in ogni disegno equivale al cambiamento 
del fattore inclinazione; le sezioni a due dimensioni illustrano assai più chiaramente l’effetto di 
questo fattore. L’insieme di biforcazione a quattro dimensioni della catastrofe a ombelico 
parabolico è anch’esso visibile solo in una sezione tridimensionale ed è il risultato di un tracciato 
elaborato con l’aiuto di un calcolatore da A.N. Godwin del Lancaster Polytechnic in Inghilterra. 


nazione, che variano dall’attacco genera¬ 
le, a risposte militari meno vistose, come 
i blocchi militari, fino alla sospensione 
delle ostilità e alla resa. In una situazio¬ 
ne in cui sono alti sia la minaccia sia il 
costo, l’opinione pubblica diventa bimo¬ 
dale, poiché la nazione è divisa in «co¬ 
lombe», favorevoli alla resa, e in «fal¬ 
chi», favorevoli all’attacco. Nel model¬ 
lo, la dinamica è la sensibilità del gover¬ 
no nei confronti dei propri elettori; il 
governo cerca sempre di modificare la 
propria politica al fine di aumentare il 
consenso, e perciò esso resta sulla su¬ 
perficie di comportamento. Possiamo 
dedurre e riconoscere per mezzo del mo¬ 
dello le catastrofi possibili. Una nazione 
minacciata può fare ripetute concessioni, 
ma c’è un limite al di là del quale un’ul¬ 
teriore intimidazione provoca un’im¬ 
provvisa dichiarazione di guerra. Vice¬ 
versa, con l’aumento del costo una na¬ 
zione può continuare a intensificare l’a¬ 
zione di guerra, ma c’è un limite al di là 
del quale un’ulteriore aumento del costo 
può portare a una resa improvvisa. L’i¬ 
steresi può essere osservata nel ritardo 
con cui può avvenire la dichiarazione di 
guerra o la resa. La regione inaccessibile 
dell’asse del comportamento è la zona 
intermedia che rappresenta il negoziato o 
il compromesso. Infine, la divergenza si 
può osservare in un conflitto tra due na¬ 
zioni di uguale potenza, in cui l’anda¬ 
mento dell’opinione pubblica è simile, 
ma la risposta del governo è compieta- 
mente diversa; uno diventa sempre più 
aggressivo, l’altro sempre più remissivo. 

Un altro fenomeno che può essere a- 
nalizzato mediante una catastrofe a cu¬ 
spide è il mercato finanziario, dove i 
termini di «mercato in rialzo» e «merca¬ 
to in ribasso» suggeriscono un’ovvia bi- 
modalità. E ancora, un crollo o un col¬ 
lasso del mercato viene prontamente il¬ 
lustrato dal grafico con un salto cata¬ 
strofico da un piano all’altro della su¬ 
perficie di comportamento. 

Per costruire questo modello è neces¬ 
saria una piccola modifica. In questo 
caso gli assi di controllo non divergono 
su ciascun lato della cuspide, come av¬ 
viene nei casi precedenti; invece un asse 
viene in avanti sul grafico, bisecando la 
cuspide, e l’altro è perpendicolare alla 
cuspide (si veda la figura in basso a 
pagina 164). Il parametro che biseca la 
cuspide è chiamato fattore di biforcazio¬ 
ne poiché un suo aumento provoca una 
divergenza sempre crescente tra il piano 
superiore e quello inferiore. L’altro fat¬ 
tore è il fattore normale, poiché nella 
parte posteriore della superficie di com¬ 
portamento il comportamento si svilup¬ 
pa in modo continuo rispetto a esso. 

Nel modello del mercato finanziario il 
fattore normale è una domanda ecceden¬ 
te rispetto all’offerta; il fattore di bifor¬ 
cazione è forse più difficile da identifica¬ 
re, ma potrebbe essere messo in relazio¬ 
ne all’ammontare delle azioni controllate 
dagli speculatori rapportato a quello in 
possesso di coloro che investono a lungo 
termine. Un mercato con un indice che 
sale è un mercato in rialzo, e il suo 
puntò di comportamento si trova sul pia¬ 


no superiore; un indice in diminuzione, 
ossia un mercato in ribasso, vede il pun¬ 
to di comportamento sul piano inferiore. 

Si può ora comprendere il meccanismo 
del crollo. Un mercato con una doman¬ 
da in eccesso e una grande proporzione 
di speculatori è un mercato in rialzo 
sulla superficie di comportamento supe¬ 
riore. Un crollo può essere provocato da 
qualsiasi evento che riduca la domanda 
fino a spingere il punto di comporta¬ 
mento al di là della curva di piegatura. 
Più grande è la parte del mercato con¬ 
trollata dagli speculatori, più grave sarà 
il crollo. Si potrebbe subito chiedere co¬ 
me mai la ripresa che segue è general¬ 
mente lenta, e come mai non c’è un 
«crollo di risalita», da un mercato in 
ribasso a uno in rialzo. La risposta più 
plausibile a questo interrogativo è che 


l’asse del comportamento (il tasso di 
cambiamento dell’indice) ha un’influen¬ 
za sui parametri di controllo per mezzo 
di un ciclo di retroazione. Un mercato in 
ribasso scoraggia la speculazione, ma do¬ 
po un certo tempo la svalutazione dei ti¬ 
toli che ne consegue incoraggia gli inve¬ 
stimenti a lungo termine e di conseguen¬ 
za, dopo un crollo, il fattore di biforca¬ 
zione si riduce e il mercato ritorna a 
spostarsi sul grafico verso una regione in 
cui la superficie di comportamento non è 
più bimodale. Con il crescere della fidu¬ 
cia e con il prodursi di un eccesso di 
domanda l’indice si rialza, ma a poco a 
poco e in maniera continua, senza cata¬ 
strofi. Ora è la speculazione a essere in¬ 
coraggiata e gli investimenti a essere sco¬ 
raggiati, ed esistono di nuovo le condi¬ 
zioni ideali per la formazione di un nuo- 
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vo ciclo di espansione e di depressione. 

Come si è precisato più sopra, la mag¬ 
gior parte delle applicazioni della teoria 
delle catastrofi sono state fatte in biolo¬ 
gia e nelle scienze sociali, laddove altre 
tecniche di costruzione di modelli risul¬ 
tano inefficaci ai fini dell’informazione; 
ma si danno molte situazioni nel campo 
della fisica (scienza che dispone di un 
linguaggio matematico altamente svilup¬ 
pato), in cui questa teoria può offrire un 
utile contributo alla comprensione degli 
eventi. Una di queste situazioni è ad 
esempio la transizione della materia dal¬ 
lo stato liquido a quello gassoso. Possia¬ 
mo riscrivere le equazioni di J.D. van 
der Waals come una catastrofe a cuspi¬ 
de, in cui la temperatura e la pressione 
sono i due fattori di controllo in conflit¬ 
to e la densità è l’asse di comportamen¬ 
to. La superficie superiore è allora lo 
stato liquido e la superficie inferiore è Io 
stato gassoso; le due catastrofi rappre¬ 
sentano l’ebollizione e la condensazione. 
Il vertice della cuspide è il punto critico, 
in cui il liquido e il gas esistono nello 
stesso tempo. Girando attorno alla parte 
posteriore della cuspide, un liquido può 
diventare gas senza passare attraverso 
l’ebollizione. 

In circostanze particolari il sistema fi¬ 
sico può seguire perfettamente la super¬ 
ficie di comportamento fino al bordo di 


entrambi i piani. È possibile, con le do¬ 
vute precauzioni, per esempio, scaldare 
l’acqua molto al di là del suo normale 
punto di ebollizione, e il vapore acqueo 
può essere raffreddato molto al di sotto 
del punto di condensazione prima che 
inizi la fase di transizione. Questo tipo di 
riscaldamento e di raffreddamento oltre 
al punto critico è sfruttato nelle camere a 
bolle e nelle camere a nebbia usate per 
individuare particelle subatomiche. Nor¬ 
malmente, tuttavia, una sostanza bolle e 
si condensa a un medesimo valore di 
temperatura e pressione, così che sezio¬ 
nando la parte intermedia della piega si 
forma un «precipizio» nella superficie di 
comportamento (si veda la figura di pa¬ 
gina 165). La formazione del precipizio si 
spiega con una regola detta «convenzio¬ 
ne di Maxwell» e rispecchia il fatto che si 
tratta di un modello statistico; che de¬ 
scrive il comportamento medio di molte 
particelle. 

Un altro splendido esempio nel campo 
dell’ottica è offerto dalla caustica che si 
forma quando la luce si riflette o si ri¬ 
frange su una superficie curva. Una cau¬ 
stica assai nota è la curva a forma di 
cuspide che talvolta compare sulla super¬ 
ficie di una tazzina da caffè che brilla 
alla luce del Sole, che è formata dal ri¬ 
flesso dei raggi del Sole sulla superficie 
interna della tazza. 


Un altro esempio altrettanto comune 
di caustica, che presenta discontinuità 
sia temporali sia spaziali della luminosi¬ 
tà, è il disegno mutevole prodotto dai 
raggi di Sole sul fondo di una piscina. 
L’arcobaleno è un insieme di coni causti¬ 
ci colorati. Altre caustiche più complesse 
possono essere prodotte facendo riflette¬ 
re un raggio di sole attraverso uno spec¬ 
chio concavo o attraverso lenti sferiche o 
cilindriche (come una lampadina o una 
coppa piena d’acqua). In questa applica¬ 
zione la teoria della catastrofe ha per¬ 
messo una migliore comprensione del fe¬ 
nomeno; Thom ha dimostrato che le cau¬ 
stiche stazionarie possono avere solo tre 
tipi di punti singolari. Una sottigliezza 
matematica dell’analisi delle caustiche 
per mezzo della teoria della catastrofe è 
che non esiste dinamico; esiste invece un 
principio variazionale che dà uguale im¬ 
portanza sia ai minimi sia ai massimi. 

La catastrofe a cuspide è una figura 
tridimensionale; due dimensioni servono 
per i due parametri di controllo e una 
terza serve per l’asse di comportamento. 
Di fatto l’asse di comportamento non è 
detto che rappresenti la variazione di un 
singolo comportamento; nei modelli del 
funzionamento del cervello, per esempio, 
può rappresentare gli stati di miliardi di 
neuroni, che variano tutti contempora¬ 
neamente. Tuttavia la teoria delle cata¬ 
strofi dimostra che è sempre possibile 
selezionare una singola variabile e trac¬ 
ciare la superficie di comportamento sol¬ 
tanto rispetto a quell’asse, così da otte¬ 
nere il familiare grafico tridimensionale. 
Se si riduce il grafico a due dimensioni, 
ne risulta un modello ancora più sempli¬ 
ce: la catastrofe a piega. Nella catastrofe 
a piega c’è solo un parametro di control¬ 
lo; lo spazio di controllo è una linea 
retta e l’insieme di biforcazione è un 
unico punto su quella linea. Lo spazio di 
comportamento è una parabola, metà 
della quale rappresenta gli stati stabili, e 
l’altra metà quelli instabili. Le due re¬ 
gioni sono separate da un punto di pie¬ 
gatura direttamente sopra il punto di bi¬ 
forcazione. 

Il teorema di classificazione 

La catastrofe a piega può essere consi¬ 
derata come una sezione trasversale della 
curva di piegàtura della catastrofe a cu¬ 
spide. A sua volta, la cuspide può essere 
considerata come una quantità di cata¬ 
strofi a piega, con un nuovo punto di 
singolarità alPorigine. Sullo stesso sche¬ 
ma si possono costruire catastrofi più 
complicate, di dimensioni superiori: o- 
gnuna di queste è formata da tutte le 
catastrofi di ordine inferiore, più una 
nuova singolarità all’origine. 

Se lo spazio di controllo diventa tridi¬ 
mensionale mentre lo spazio di compor¬ 
tamento resta a una dimensione, si può 
costruire un’unica catastrofe a quattro 
dimensioni. La superficie di comporta¬ 
mento diventa un’ipersuperficie a tre di¬ 
mensioni, e anziché essere piegata lungo 
delle curve, come nella catastrofe a cu¬ 
spide, è piegata lungo delle intere super- 
fici, configurazione questa che non può 



A POLITICA BELLICA 



La catastrofe a farfalla permette di prevedere l’emergere di un’opinione di compromesso in un 
modello che descrive Io sviluppo di una politica bellica. Nella catastrofe a farfalla sono necessari 
quattro fattori di controllo, ma qui ne sono visibili solo due (la minaccia e il costo) mentre gli 
altri due si assumono costanti. L’insieme di biforcazione è una delle sezioni mostrate nella 
pagina precedente; si tratta di una curva complessa, con tre cuspidi e una «tasca» nel mezzo. Sulla 
superficie di comportamento in corrispondenza della tasca c’è un nuovo piano, che serve a 
rappresentare un nuovo modo di comportamento, intermedio rispetto agli altri. Se sono alti sia 
il valore della minaccia sia quello del costo, il modello a cuspide terrà conto solo delle posizioni 
estreme che si pronunciano per l'attacco o per la resa. Il nuovo piano nel modello a farfalla rap¬ 
presenta I emergere di un’opinione favorevole al compromesso che si pronuncia per il negoziato. 
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facilmente essere visualizzata. L’insieme 
di biforcazione non consiste più di curve 
che formano una cuspide a due dimen¬ 
sioni, ma è costituito da superfici a tre 
dimensioni che si intersecano dando luo¬ 
go a cuspidi ai loro bordi. All’origine 
compare una nuova singolarità, detta ca¬ 
tastrofe a coda di rondine. È impossibile 
rappresentare la catastrofe a coda di ron¬ 
dine in modo completo, per l’impossibi¬ 
lità di disegnare immagini a 4 dimensio¬ 
ni. Possiamo tuttavia rappresentare gra¬ 
ficamente il suo insieme di biforcazione, 
che è tridimensionale, e da questo dise¬ 
gno è possibile derivare alcune intuizioni 
geometriche circa la coda di rondine, 
allo stesso modo in cui è possibile descri¬ 
vere la catastrofe ? cuspide disegnando il 
suo insieme di biforcazione (la cuspide) 
in due dimensioni, e ricordando che la 
superficie di comportamento è bimodale 
sopra la parte interna della cuspide. 

Se aggiungiamo ancora un altro para¬ 
metro di controllo, si forma una cata¬ 
strofe a 5 dimensioni. La piega, la cuspi¬ 
de e la coda di rondine appaiono anche 
qui come sezioni, e una nuova singolari¬ 
tà viene associata a una «tasca» formata 
dall’interpenetrazione di parecchie super¬ 
fici. La forma di questa tasca, o delle 
sue sezioni, ha suggerito il nome di cata¬ 
strofe a farfalla. Nella catastrofe a far¬ 
falla anche l’insieme di biforcazione è a 
quattro dimensioni e perciò non può es¬ 
sere disegnato. Lo si può illustrare solo 
mediante sezioni a due o a tre dimensio¬ 
ni (si veda l’illustrazione di pagina 167). 

Ci sono ancora due catastrofi a cinque 
dimensioni, che si formano quando lo 
spazio di controllo ha tre dimensioni e lo 
spazio di comportamento ha due dimen¬ 
sioni. Sono chiamate la catastrofe a om¬ 
belico iperbolico e la catastrofe a ombe¬ 
lico ellittico. Come nel caso della coda di 
rondine, i loro insiemi di biforcazione 
consistono di superfici con i bordi a 
cuspide, e possono essere disegnate dal 
momento che sono a tre dimensioni. In¬ 
fine, la catastrofe a sei dimensioni gene¬ 
rata da uno spazio di controllo a quattro 
dimensioni e da uno spazio di comporta¬ 
mento a due dimensioni è chiamata om¬ 
belico parabolico. La sua geometria è 
complessa, e ancora una volta si può 
rappresentare graficamente solo il suo 
insieme di biforcazione. 

Col crescere del numero delle dimen¬ 
sioni dello spazio di controllo e dello 
spazio di comportamento si può costrui¬ 
re una serie infinita di catastrofi. Il ma¬ 
tematico russo V.I. Arnold le ha classifi¬ 
cate fino ad almeno 25 dimensioni. Per 
modelli che riguardano fenomeni del 
mondo reale, tuttavia, le 7 descritte so¬ 
pra sono probabilmente le più importan¬ 
ti, poiché sono le uniche che hanno uno 
spazio di controllo che non ha più di 
quattro dimensioni. Una classe partico¬ 
larmente comune di processi, quelli de¬ 
terminati dalla posizione nello spazio e 
nel tempo, non possono richiedere uno 
spazio di controllo con più di quattro di¬ 
mensioni, poiché il nostro mondo ha 
solo tre dimensioni spaziali e una tempo¬ 
rale. 

Anche le catastrofi che non possono 




L’anoressia nervosa, un disturbo nervoso che si manifesta in adolescenti e giovani donne che si 
sottopongono a digiuni ossessivi, può essere descritto per mezzo di una catastrofe a farfalla. 
Due dei fattori di controllo sono la fame e un atteggiamento anormale verso il cibo. Negli 
individui normali la fame conduce a un ciclo di comportamento che oscilla tra il nutrirsi e la 
sazietà; nell’individuo anoressico, con atteggiamenti anormali, il medesimo ciclo di fame 
conduce a comportamenti assai differenti. Nella prima fase della malattia (in alto) il ciclo resta 
nel piano inferiore della superficie di comportamento, e l’individuo anoressico rimane costante- 
mente in uno stato mentale concentrato sul digiuno. La seconda fase (in basso) viene determina¬ 
ta dal cambiamento di un terzo fattore, il controllo cosciente. Quando la paziente perde il 
controllo di se stessa dopo un periodo di due anni o più, l’insieme di biforcazione viene deviato 
a sinistra fino a quando il ciclo della fame attraversa il lato destro della cuspide. A questo punto 
la persona entra in un ciclo di isteresi; digiuna fino a quando la fame la costringe a «lasciarsi 
andare» in maniera catastrofica, e allora si abbuffa fino a che, dopo una catastrofe di «knock¬ 
out», ricomincia a digiunare e a depurarsi da quello che essa vive come una contaminazione. 
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essere rappresentate possono essere im¬ 
piegate per descrivere i fenomeni per 
mezzo di modelli. La loro geometria è 
completamente determinata, e il movi¬ 
mento di un punto sulla superficie di 
comportamento può essere studiato ana¬ 
liticamente anche se non può essere rap¬ 
presentato graficamente. Ogni catastrofe 
è definita da una funzione potenziale, e 
in ogni caso la superficie di comporta¬ 
mento è il grafico di tutti i punti in cui 
la derivata prima di quella funzione è 
uguale a zero. 

Il punto di forza della teoria di Thom 
sta nella sua generalità e completezza. 
Essa stabilisce che se un processo viene 
determinato dalla minimizzazione o dal¬ 
la massimizzazione di alcune funzioni, e 
se è controllato da non più di 4 fattori, 
allora ogni e qualsiasi singolarità della 
superficie di comportamento che ne ri¬ 
sulta deve essere analoga a una delle 
sette catastrofi che abbiamo descritto. Se 
il processo è controllato da due soli fat¬ 
tori, allora la superficie di comportamen¬ 
to può avere solo pieghe e cuspidi. Il 
teorema stabilisce, insomma, che in ogni 
processo regolato da due fattori, la cata¬ 
strofe a cuspide è la cosa più complicata 
che può verificarsi nel grafico. La dimo¬ 
strazione del teorema è troppo tecnica e 
troppo lunga per poter essere presentata 
qui, ma le sue conseguenze sono molto 
chiare: ogni volta che una forza che cam¬ 
bia in maniera continua produce come 
effetto un cambiamento improvviso, il 
processo deve essere descritto mediante 
una catastrofe. 

Dopo la catastrofe a cuspide, quella 
che ha lo spettro più vasto di applicazio¬ 
ni è la catastrofe a farfalla. Così come 
un comportamento bimodale determina 
il modello a cuspide, allo stesso modo 
un comportamento trimodale determina 
quello a farfalla. Nel modello a cuspide 
della politica bellica, per esempio, in cui 
l’opinione pubblica è divisa tra «colom¬ 
be» e «falchi», il modello a farfalla con¬ 
templa l’emergere di un’opinione di com¬ 
promesso favorevole al negoziato. Que¬ 
sta nuova alternativa si presenta come 
un nuovo piano della superficie di com¬ 
portamento, che sale in maniera conti¬ 
nua nella parte posteriore della piega (si 
veda l’illustrazione a pagina 168). 

La geometria della catastrofe a farfal¬ 
la è controllata da quattro parametri. 
Due di questi sono già noti dai modelli a 
cuspide: il fattore normale e il fattore di 
biforcazione. I due rimanenti sono nuo¬ 
vi: il fattore divergenza e il fattore far¬ 
falla. L’effetto del fattore divergenza è 
quello di alterare la posizione e la forma 
della cuspide: esso sposta la parte princi¬ 
pale della cuspide a destra o a sinistra, 
mentre il vertice della cuspide si piega 
nella direzione opposta. Nello stesso tem¬ 
po, il fattore divergenza sposta la su¬ 
perficie di comportamento in su e in giù. 

L’effetto del fattore farfalla è quello 
di dar luogo al terzo modo stabile di 
comportamento. Con l’aumento del fat¬ 
tore farfalla, la cuspide sulla superficie 
di controllo si sviluppa in tre cuspidi, 
che formano una «tasca» triangolare. 
Sopra la tasca c’è la nuova superficie 


triangolare, sulla superficie di comporta¬ 
mento, tra il piano superiore e quello 
inferiore. 

Per tracciare il grafico della catastrofe 
a farfalla occorre sopprimere due dei 
quattro parametri, e di solito si elimina¬ 
no il fattore inclinazione e il fattore far¬ 
falla. La loro influenza sul grafico non 
può tuttavia essere ignorata. Un effetto 
del fattore divergenza è quello di ridurre 
un lato della tasca fino a farla scompari¬ 
re in una catastrofe a coda di rondine; il 
fattore divergenza tende perciò a distrug¬ 
gere la possibilità di un compromesso. 
Poiché il fattore farfalla controlla la cre¬ 
scita del piano intermedio di comporta¬ 
mento, esso sviluppa la stabilità di un 
compromesso. 

Anoressia nervosa 

Una seconda applicazione della cata¬ 
strofe a farfalla, di una straordinaria fe¬ 
condità, è quella che si fa all’anoressia 
nervosa, un disturbo nervoso frequente 
soprattutto in adolescenti e giovani don¬ 
ne per le quali la dieta è degenerata in un 
digiuno ossessivo. Il modello è stato svi¬ 
luppato da me in collaborazione con J. 
Hevesi, uno psicoterapista inglese che ha 
introdotto la terapia per mezzo della 
trance nel trattamento dell’anoressia. In 
una recente indagine, risulta che su 1000 
pazienti sofferenti dLanoressia, quelli che 
erano stati curati da lui erano i soli dei 
quali si potesse affermare che fossero 
guariti completamente. 


Nella fase iniziale dell’anoressia il di¬ 
giuno ossessivo può condurre all’inedia, 
e in qualche caso anche alla morte. Col 
passare del tempo, gli atteggiamenti del¬ 
la paziente verso il cibo diventano pro¬ 
gressivamente anormali. Dopo circa due 
anni si sviluppa di solito una seconda 
fase, chiamata bulimia, durante la quale 
la malata alternativamente digiuna e si 
rimpinza di cibo. Il comportamento bi¬ 
modale di questa seconda fase suggerisce 
immediatamente una catastrofe a cuspi¬ 
de. La malata di anoressia precipita in 
un ciclo di isteresi, saltando in maniera 
catastrofica tra due estremi, e non riesce 
ad approdare al comportamento norma¬ 
le che sta tra questi due. La teoria delle 
catastrofi suggerisce anche una cura teo¬ 
rica: se si potesse indurre una nuova bi¬ 
forcazione, come nella catastrofe a far¬ 
falla, si potrebbe riaprire la via alla nor¬ 
malità. 

La superficie di comportamento in 
questo modello rappresenta il comporta¬ 
mento manifesto della paziente, che va¬ 
ria dal riempirsi esageratamente di cibo, 
attraverso il cibarsi normalmente a sazie¬ 
tà, fino al digiuno ossessivo. Essa forni¬ 
sce anche alcune indicazioni circa gli sta¬ 
ti cerebrali sottostanti al comportamen¬ 
to; come nel modello dell’aggressione, 
abbiamo a che fare con degli stati emo¬ 
zionali che hanno probabilmente origine 
nel sistema limbico. I dati raccolti dagli 
psicologi suggeriscono che la variabile 
del comportamento può costituire effet¬ 
tivamente una misura dell’importanza re- 



II trattamento dell’anoressia si fonda sulla creazione di un terzo modo di comportarsi intermedio. 
Il nuovo comportamento è reso possibile aumentando il quarto parametro di controllo della 
catastrofe a farfalla: la rassicurazione. Ciò crea una tasca nell’insieme di biforcazione e quindi 
un piano intermedio nella superficie di comportamento. In un primo tempo la paziente entra ed 
esce dalla trance con salti catastrofici dal piano intermedio al piano superiore e a quello 
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lativa che il sistema limbico assegna agli 
stimoli provenienti dal corpo in contrap¬ 
posizione a quelli provenienti dalla cor¬ 
teccia cerebrale. In una persona normale 
questi stimoli possono essere in un certo 
senso bilanciati, ma nella malata anores¬ 
sica l’uno o l’altro tendono a essere do¬ 
minanti. 

Tra i parametri di controllo, il fattore 
normale è la fame, che nelle persone 
normali regola il ciclo ritmico di nutri¬ 
zione e sazietà. Il fattore di biforcazione 
è il grado di anormalità degli atteggia¬ 
menti della paziente anoressica verso il 
cibo; l’anormalità aumenta man mano 
che la sua condizione peggiora. 

Il fattore divergenza nel grafico a far¬ 
falla è la perdita dell’autocontrollo, che 
può essere misurata con la perdita di 
peso. Nella prima fase del disturbo gli 
atteggiamenti della malata di anoressia 
sono già anormali, ma essa mantiene 
l’autocontrollo. Il risultato è che essa 
rimane relegata sul piano inferiore della 
superficie di comportamento; per tutto il 
tempo della veglia, il sistema limbico 
resta in uno stato corrispondente a uno 
stato d’animo concentrato sul digiuno, 
anche quando prende i suoi pasti ridot¬ 
tissimi. 

Man mano che la malata anoressica 
diminuisce di peso, perde anche l’auto¬ 
controllo, e il fattore divergenza aumen¬ 
ta gradualmente. Il risultato è che la cu¬ 
spide oscilla verso la sinistra del grafico 
(si veda l’illustrazione in alto a pagina 
169); se si sposta abbastanza lontano, la 
parte destra della cuspide interseca il ci¬ 
clo anoressico, provocando l’inizio im¬ 
provviso della seconda fase. Ora la mala¬ 
ta non è più imprigionata in un ciclo di 
digiuno costante, ma cade in un ciclo di 
isteresi, saltando avanti e indietro dal 
piano inferiore a quello superiore. Con 
le parole di un'anoressica tipica, il salto 
catastrofico dal digiuno all’ingordigia av¬ 
viene quando la persona «si lascia anda¬ 
re» e osserva indifesa il «mostro dentro 
di lei» che si abbuffa di cibo per diverse 
ore, a volte anche vomitando. Il ritorno 



inferiore, come indicato nella sezione a destra. 
Quando la terapia ha un effetto positivo, tut¬ 
tavia, la paziente compie una graduale transi¬ 
zione dal piano intermedio ai modi di compor¬ 
tamento normali rappresentati dietro la tasca. 


catastrofico al digiuno avviene quando 
la stanchezza, il disgusto e l’umiliazione 
la travolgono, esperienza questa che mol¬ 
te malate chiamano knockout. 

Il periodo di digiuno che segue il kno¬ 
ckout nel ciclo di isteresi è diverso dal 
digiuno regolare della prima fase. Si tro¬ 
va in una posizione diversa sull’asse di 
comportamento e si potrebbe chiamare 
più appropriatamente fase di depurazio¬ 
ne. Lo stato limbico che è associato al 
primo digiuno è dominato dagli impulsi 
provenienti dalla corteccia cerebrale ed è 
finalizzato a impedire l’entrata del cibo. 
Durante il periodo di ingordigia il siste¬ 
ma limbico è dominato da impulsi pro¬ 
venienti dal corpo. Lo stato limbico sot¬ 
tostante il periodo seguente di depura¬ 
zione è ancora dominato da impulsi ce¬ 
rebrali, ma di questi una parte proviene 
dal corpo ed è diretta a liberarlo dalla 
contaminazione. 

La terapia della trance usata da Hevesi 
rassicura la paziente, riduce la sua incer¬ 
tezza e la mette perciò in grado di rigua¬ 
dagnare la via verso il comportamento 
normale. Le malate anoressiche tendono 
a dormire irregolarmente, e quando sono 
sveglie vivono esperienze spontanee simi¬ 
li alla trance; è su questi periodi che in¬ 
terviene il terapista. La trance può rap¬ 
presentare il terzo stato del sistema lim¬ 
bico, nella zona altrimenti inaccessibile 
tra gli stati di ingordigia e di depurazio¬ 
ne. Quando la paziente digiuna vive con 
grande ansietà il mondo esterno, e quan¬ 
do si abbuffa se ne sente sopraffatta; ma 
durante la trance essa è isolata, la sua 
mente è libera sia dal cibo sia dalla preoc¬ 
cupazione di evitarlo. È solo a questo 
punto che è possibile intervenire con la 
rassicurazione. 

La rassicurazione diviene il fattore far¬ 
falla nel modello. Essa dà luogo a un 
nuovo piano sulla superficie di compor¬ 
tamento, piano che si trova tra gli altri 
due e che eventualmente può dare acces¬ 
so alla regione stabile, della normalità, 
dietro la cuspide. Poiché la terapia gene¬ 
ralmente avviene durante il momento del 
digiuno del ciclo, l’entrata nella trance 
equivale a un salto catastrofico dal piano 
inferiore a quello intermedio. L’uscita 
dalla trance è un’altra catastrofe, che 
può condurre la paziente sia al piano 
inferiore sia a quello superiore. 

Dopo circa due settimane di trattamen¬ 
to e circa nella settima seduta di trance, 
l’atteggiamento anormale della paziente 
nei confronti del cibo si esaurisce in ma¬ 
niera catastrofica, e la personalità si riu¬ 
nifica di nuovo in un tutto integrato. 
Quando la paziente si risveglia dalla tran¬ 
ce, ne può parlare come di un «momento 
di rinascita» e scopre che può mangiare 
di nuovo senza paura di abbuffarsi. La 
trance ha apparentemente riaperto una 
via di ritorno del cervello a stati limbici 
più equilibrati, così che la paziente può 
riacquistare un comportamento normale. 
La seduta di trance seguente rinforza 
l’esperienza. 

Uno dei punti di forza del modello 
della teoria della catastrofe sull’anores¬ 
sia nervosa è che esso rende conto della 
descrizione che la paziente fa del proprio 


stato. I termini quasi incomprensibili con 
i quali alcune malate di anoressia descri¬ 
vono il loro malessere si rivelano piutto¬ 
sto ovvi considerati nel quadro delle su- 
perfici della catastrofe. Il vantaggio di 
un linguaggio matematico in questo tipo 
di applicazioni è che è psicologicamente 
neutro. Esso permette una sintesi di os¬ 
servazioni che potrebbero altrimenti sem¬ 
brare sconnesse. 

Il futuro della teoria delle catastrofi 

La teoria della catastrofe è assai re¬ 
cente: Thom ha pubblicato il primo arti¬ 
colo nel 1968. Finora il suo impatto mag¬ 
giore è avvenuto nei confronti della ma¬ 
tematica stessa; in particolare ha stimo¬ 
lato altri settori della matematica che 
erano necessari per dimostrare i suoi teo¬ 
remi. I principali problemi insoluti di 
questa teoria riguardano la comprensio¬ 
ne e la classificazione delle catastrofi 
generalizzate e le catastrofi più sofistica¬ 
te che si presentano quando si impongo¬ 
no condizioni di simmetria. Inoltre esi¬ 
stono problemi connessi al modo in cui 
la teoria delle catastrofi può essere usata 
insieme ad altri metodi e concetti mate¬ 
matici. 

Si stanno studiando nuove applicazio¬ 
ni di questa teoria in molti campi. In fi¬ 
sica e in ingegneria sono stati elaborati 
modelli della propagazione di onde si¬ 
smiche, sull’area minima delle superfici, 
le oscillazioni non lineari, la dispersione 
e l’elasticità. Michael V. Berry dell’Uni¬ 
versità di Bristol ha recentemente utiliz¬ 
zato le catastrofi a ombelico per ottenere 
nuovi risultati nella fisica delle caustiche 
e nella meccanica dei fluidi, e ha confer¬ 
mato sperimentalmente questi risultati. 

Structural Stability and Morphogenesis 
di Thom, ispirato dal lavoro di D’Arcy 
Wentworth Thompson e C.H. Wadding- 
ton, era largamente connesso all’embrio¬ 
logia, ma per ora soltanto pochi biologi 
hanno tentato un’applicazione sperimen¬ 
tale delle sue ipotesi in laboratorio. Io 
ho costruito dei modelli a catastrofe dei- 
battito cardiaco, della propagazione de¬ 
gli impulsi nervosi e della formazione 
della gastrula e dei somiti nell’embrione. 
Esperimenti recenti condotti da J. Cooke 
del laboratorio del Medicai Research 
Council di Edimburgo sembrano confer¬ 
mare alcune delle mie previsioni. 

Gran parte del mio stesso lavoro, tut¬ 
tavia, si è svolto nel campo delle scienze 
umane, come si vede anche dai modelli 
descritti in questo articolo. Un numero 
sempre maggiore di ricercatori sta svi¬ 
luppando modelli derivati dalla teoria 
della catastrofe, e nei prossimi dieci anni 
ritengo che questi modelli saranno verifi¬ 
cati sperimentalmente. Solo allora potre¬ 
mo valutare il valore reale di questo me¬ 
todo. 

Thom ha usato la sua teoria nel tenta¬ 
tivo di capire come si forma il linguag¬ 
gio. Ed è affascinante pensare che lo 
stesso apparato matematico possa spie¬ 
gare non solo come il codice genetico 
controlla lo sviluppo deH’embrione ma 
anche come la parola scritta faccia schiu¬ 
dere la nostra immaginazione. 
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Scientific American. Successivamente cominciò a interes¬ 
sarsi di matematica e si è laureato in questa materia all’Uni¬ 
versità di New York. 


Bibliografìa 

BOYER CARL B., The History of thè Calculus and Its Con- 
ceptual Development, Dover Publications, 1959. 

ROBINSON ABRAHAM, Non-Standard Analysis, North-Hol- 
land Publishing Co., 1966. 

lolli Gabriele, Nuovi modelli del sistema dei numeri 
reali, in questo volume a pagina 42. 

lightstone a.h., Infìnitesimals in « The American Ma¬ 
thematical Monthly », 79, n. 3, 1972. 

Robinson a., Teoria dei modelli e metamatematica del¬ 
l’algebra, Boringhieri, Torino 1974. 


5 Nuovi modelli del sistema dei numeri reali 


Autore 

GABRIELE LOLLI è professore straordinario di logica 
presso 1 Università di Genova. Laureato in matematica 
nel 1965 all’Università di Torino, si è specializzato in ri¬ 
cerche di logica matematica e di teoria degli insiemi. Nel 
1970-71 è stato visiting fellow presso il Dipartimento di ma¬ 
tematica della Yale University. Tra le sue ultime pubblica¬ 
zioni ricordiamo Categorie, universi e principi di riflessione 
Boringhieri, Torino 1977. 

Bibliografìa 

feferman solomon, The Number Systems, Addison-Wes- 
ley, 1964. 


choquet, g.. La retta numerica in Strutture algebriche e 
strutture topologiche, Feltrinelli, 1963. 

halmos, p.r., Measure Theory, Van Nostrand, 1950. 
rasiowa h., sikorski r„ The Mathematics of Metama- 
thematics, P.W.N. Warszawa, 1963. 

scott d., A Proof of thè Independence of thè Continuum 
Hypothesis, in «Mathematical System Theory», n. 1, 1967. 

lolli Gabriele, Teoria assiomatica degli insiemi, Borin- 
ghieri, Torino 1974. 


6 Tre personaggi della matematica 

Autore 

BRUNO DE FINETTI è professore di calcolo delle pro¬ 
babilità nella Facoltà di scienze dell’Università di Roma. 
Appena laureatosi in matematica alla Università di Milano 
entrò all’Istituto centrale di statistica, e poi in una com¬ 
pagnia di assicurazione (con mansioni statistico-attuariali 
e di razionalizzazione e meccanizzazione di procedure tec¬ 
nico-contabili), dedicandosi contemporaneamente, nel tem¬ 
po libero, a ricerche matematiche, prevalentemente nel 
campo della teoria delle probabilità. Lasciò tali attività nel 
1946 per entrare nella carriera universitaria (a Trieste e 
poi a Roma), dapprima alla cattedra di matematica attua¬ 
riale. Si interessa fattivamente anche ai problemi dell’inse¬ 
gnamento della matematica (di cui propugna un profondo 
rinnovamento), in particolare operando in seno alla Com¬ 
missione italiana per l’insegnamento matematico e alla so¬ 
cietà Mathesis, di cui dal 1970 è presidente. Fa anche parte 
del Comitato tecnico per la programmazione del Ministero 
della pubblica istruzione che ha pubblicato le «Proposte 
per il nuovo piano della scuola». 


Bibliografia 

klein felix, Elementarmathematik vom Hòheren Stand- 
punkte aus, (3 voli.), Springer, Berlino, 1924. 

tricomi Francesco, Funzioni analitiche, Zanichelli, Bo¬ 
logna, 1946. 

de finetti bruno. Matematica logico-intuitiva, Cremo¬ 
nese, Roma, 1960. 

de finetti bruno. Il « saper vedere » in matematica, 
Loescher, Torino, 1967. 

de finetti bruno. Le proposte per la matematica nei 
nuovi licei: informazioni, commenti critici, suggerimenti, 
in «Periodico di Matematiche», 45, 2, 1967. 

bruner jerome s.. Il conoscere: Saggi per la mano sini¬ 
stra, Armando, Roma, 1968. 

polya George, Come risolvere i problemi di matematica; 
La scoperta matematica (/ e II), Feltrinelli, Milano, 1967, 
1971-1974. 

campedelli luigi. La geometria dei parallelogrammi. 
Le Monnier, Firenze, 1970. 

dieudonné JEAN, Algebra lineare e geometria elementare, 
Feltrinelli, Milano, 1970. 


7 Algebre di Boole, diagrammi di Venn e 
calcolo proposizionale 

I Autore 

MARTIN GARDNER, per la biografia si rimanda al¬ 
l’articolo precedente. 


Bibliografia 

whitesitt eldon j., Boolean Algebra and Its Applica¬ 
tions, Addison Wesley Publishing Company, 1961. 
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Arnold B.H., Logic and Boolean Algebra, Prentice-Hall, 
Ine. 1962. 

mendelson elliott. Algebra di Boote, Etas Libri, Mi¬ 
lano, 1977. 


8 Verità è dimostrazione 

Autore 

ALFRED TARSKI è professore di matematica all’Uni¬ 
versità di California a Berkeley. Nato in Polonia, si è lau¬ 
reato alla Univesità di Varsavia nel 1924 ove è restato fino 
al 1939, allorché si è trasferito negli USA. E’ stato professore 
associato alla Harvard University per due anni e quindi 
membro dellTnstitute for Advanced Study per un anno, pri¬ 
ma di passare a Berkeley. Tra i suoi vari scritti, citiamo 
Introduction to Logic and to thè Metodology of Deductive 
Sciences che è stato pubblicato in 10 lingue (traduzione 
italiana, Introduzione alla logica, Bompiani, Milano 1969). 
L’articolo qui pubblicato è basato su una conferenza tenu¬ 
ta a Berkeley nel 1963 e su un discorso tenuto all’Univer¬ 
sità di Londra nel 1966. 


Bibliografia 

tarski ALFRED, The Semantic Conception of Truth in 
Semantics and thè Philosophy of Language, a cura di Léo¬ 
nard Linsky, University of Illinois Press, 1952. 

tarsky Alfred, The Concepì of Truth in Formalized Lan- 
guages in Logic, Semantics, Metamathematics, Clarendon 
Press, 1956. 

tarski Alfred, Introduction to Logic and to thè Metho- 
dology of Deductive Science, Oxford University Press, 
1965 (traduzione italiana, Introduzione alla logica, Bom¬ 
piani, Milano, 1969). 

dalla chiara scabia maria luisa, Modelli sintattici e 
semantici delle teorie elementari, Feltrinelli, Milano 1969. 

mendelson elliot, Introduzione alla logica matematica, 
Boringhieri, Torino 1972. 

DALLA CHIARA SCABIA MARIA LUISA, La logica, ISEDI, 
Milano 1973. 


9 Un libro di logica smarrito di Lewis Carroll 

Autore 

W.W. BARTLEY III è professore di filosofia e di storia 
della filosofia e della scienza all’Università di Pittsburg, 
dove inoltre lavora come Direttore aggregato del Centro 
per la filosofia della scienza. E’ anche docente di filosofia al¬ 
l’Università statale della California ad Hayward. Bar- 
tley si è diplomato ad Harvard nel 1956 e si è laureato in 
logica e metodo scientifico alla London School of Eco- 
nomics nel 1962. 

Bibliografia 

carroll lewis. Il gioco della logica, Astrolabio, 1969. 
carroll lewis, Una storia ingarbugliata, Astrolabio, 
1969. 

Martin robert l. (a cura di), The Paradox of thè Liar, 
Yale University Press, 1970. 

copi irving m. e gould james a. (a cura di), Readings 
on Logic, The Macmillan Company, 1972. 

mangione Corrado, La svolta della logica nell’Ottocento; 
Logica e problemi dei fondamenti nella seconda metà del¬ 
l'Ottocento; La logica nel XX secolo in Storia del pensiero 
filosofico e scientifico di Ludovico Geymonat (voi. 5 e 6), 
Garzanti, 1970-72. 


10 Un nuovo livello di astrazione: 
la teoria delle categorie 

Autore 

LUCIO LOMBARDO RADICE è professore ordinario 
di algebra all’Università di Roma. Nato a Catania si è 
laureato in matematica nel 1938. Fu costretto a interrom¬ 
pere l’attività accademica perché incarcerato per attività 
antifascista. Nel 1945 riprese il suo posto di assistente al¬ 
l’Università di Roma dove restò fino al 1956, quando diven¬ 
ne professore di geometria all’Università di Palermo. Nel 
1960 ritornò a Roma come professore prima di geometria 
e poi di algebra quando questa cattedra fu istituita nell’uni¬ 
versità italiana. Oltre che di vari scritti e memorie scien¬ 
tifiche, è autore del volume Istituzioni di algebra astratta. 


Bibliografìa 

freyd p.m., Abelian Categories, Columbia University 
Press, 1962. 

mitchell b., Theory of Categories, Academic Press, 
New York, 1965. 

cohn p.m., Universal Algebra, Harper and Row, New 
York, 1965. 

hasse m. e michler l„ Theorie der Kategorien, VEB 
Deutscher Verlag der Wissenschaften, 1965. 

brinkmann h.b. e puppe d., Kategorien und Funktoren, 
Springer, Berlino, 1966. 

mac lane s. e birkhoff g.. Algebra, McMillan, Londra, 
1967,traduzione italiana Algebra, Mursia, Milano 1975. 

BALDASSARRI GHEZZO S., MARGAGLIO C. e MILLEVOI T., 
Introduzione ai metodi della geometria algebrica, Cremo¬ 
nese, Roma, 1967. 

bucur i. e deleanu A., Introduction to thè Theory of 
Categories and Functors, Interscience Publications New 
York, 1968. 

pareigis bodo, Categories and Functors, Academis Press, 
New York, 1970. 

mac lane saunders, Categories for thè Working Math- 
ematician, Springer, New York, Heidelberg, Berlino, 1971; 
traduzione italiana Categorie nella pratica matematica, 
Boringhieri, Torino 1977. 

higgins Philip J., Notes on Categories and Grupoids, 
van Nostrand, Londra, 1971. 

horst schubert, Categories, Springer, Berlino, 1972. 


11 Induzione e probabilità 

Autori 

DOMENICO COSTANTINI e MARCO MONDADORI 
si occupano ormai da anni di logica induttiva. Costantini si 
è laureato in scienze statistiche all’Università di Roma e 
quindi specializzato in filosofia della scienza all’Università 
di Milano; attualmente è docente di calcolo delle probabi¬ 
lità all’Università di Bologna. Mondadori si è laureato in 
filosofia all’Università di Milano e attualmente insegna al¬ 
l’Università di Bologna. 

Bibliografia 

carnap r. e jeffrey r.c., Studies in Inductive logie and 
Probability, University of California Press, 1971. 

carnap R., Analiticità, Significanza, Induzione a cura 
di A. Meotti e M. Mondadori, Il Mulino, 1971. 

Costantini D ., Fondamenti del calcolo delle probabilità, 
Feltrinelli, 1970. 

essler W.K., Induktive Logik, Grundlagen und Voraus- 
setzunge, Verlag K. Alber, 1970. 

Costantini D. Introduzione alla probabilità, Boringhieri, 
Torino 1977. 
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12 I problemi della conferma 

Autore 

WESLEY C. SALMON dopo essere stato professore di 
filosofia della scienza all’Università dell’Indiana è passato 
all’Università dell’Arizona come professore di filosofia. Si 
è diplomato all’Università di Chicago e si è laureato in fi¬ 
losofia all’Università della California a Los Angeles. Ha 
lasciato recentemente la carica di presidente dell’Associa¬ 
zione americana per la filosofia della scienza. 


Bibliografia 

HUME DAVID, Ricerche sull’intelletto umano, Laterza 
1968. 

carnap rudolf. Logicai Foundations of Probability, The 
University of Chicago Press, 1962. 

skyrms brian, Choice and Chance: An Introduction to 
Inductive Logic, Dickenson Publishing Co., 1966. 

SALMON WESLEY c„ The Foundations of Scientific Infe- 
rence, University of Pittsburgh Press, 1967. 

LUCKENBACH sidney A. <a cura di), Probalities, Problems 
and Paradoxes: Readings in Inductive Logic, Dickenson 
Publishing Co., 1971. 

salmon wesley c., Confirmation and Relevance in 
«Minnesota Studies in thè Philosophy of Science», 1973. 

carnap rudolf, AnaUticità, significamo, induzione. Il 
Mulino, 1971. 


13 Problemi non risolti deH’aritmetica 


A utore 

HOWARD DELONG è professore incaricato di filoso¬ 
fia al Trinity College di Hartford. All’università si è specia¬ 
lizzato in matematica, laureandosi al Williams College nel 
1957. Si è poi dedicato alla filosofia, laureandosi nel 1960 
presso la Princeton University. Insegna al Trinity College 
dal 1960. « Tra i miei interessi esterni - scrive - c’è lo stu¬ 
dio del mercato economico da un punto di vista logico. Per 
me presenta un fascino intellettuale del tutto indipendente 
da quello monetario corrente ». 


Bibliografia 

MYHILL john. Some Philosophical Implications of Ma¬ 
thematical Logic, I: Three classes of Ideas, in « The Re¬ 
vie w of Metaphysics », 6, n. 2, 1952. 

KEMENY JOHN g„ Undecidable Problems of Elementary 
Number Theory, in « Mathematiche Annalen », 135 n 
2, 1958. 

REID CONSTANCE, Hilbert, Springer-Verlag, 1970. 

delong Howard, A profile of Mathematical Logic, Addi- 
son-Wesley, 1970. 


14 La macchina di Turing e la questione da 
essa sollevata: può una macchina pensare? 

A utore 

MARTIN GARDNER, per la biografia si veda l’articolo 
precedente. 


Bibliografia 

BERNSTEIN JEREMY, The Analytical Engine: Computers- 
Past, Present and Future, Random House, 1964. 


ROSS ANDERSON alan (a cura) Minds and Machines 
Prentice-Hall, Ine. 1964. 

loehlin john c.. Computer Models of Personality Ran- 
don House, 1968. 

minsky MARVIN (a cura), Semantic Information Process¬ 
ing, The MIT Press, 1968. 

meltzer BERNARD e michie donald, Machine Intelligen¬ 
ce 4, Edinburgh University Press, 1969. 


15 Giochi, logica e calcolatori 

A utore 

HAO WANG ( Giochi, logica e calcolatori) insegna lo¬ 
gica matematica alla Harvard University. Wang è nato in 
Cina e si è diplomato in matematica alla National Asso¬ 
ciated University di Kunming nel 1943. Giunto negli Stati 
Uniti nel 1946 si laureò in logica a Harvard, rimanendo 
presso questa università per diversi anni come ricercatore 
e professore assistente. Nel 1954 andò in Inghilterra come 
ricercatore della Rockefeller Foundation. Nel 1955 fu John 
Locke Lecturer in Philosophy all’Università di Oxford e 
lettore di filosofia della matematica dal 1956 al 1961, an¬ 
no in cui assunse la sua carica attuale a Harvard. Wang 
è autore di A Survey of Mathematical Logic. 


Bibliografia 

wang hao, Dominoes and thè AEA Case of thè Decision 
Problem in « Proceedings of thè Symposium on Mathema¬ 
tical Theory of Automata: MRI Symposia Series, voi. XII », 
Polytechnic Press of thè Polytechnic Institute of Brooklvn’ 
1963. ’ 

hilbert d. e ackermann w., Prìnciples of Mathematical 
Logic, Chelsea Publishing Company, 1950. 

The Vndecidable: Basic Papers on Undecidable Proposi- 
tìons, Unsolvable Problems and Computable Functions, 
Raven Press, 1965. 

HERMES HANS, Enumerabilìtà, decidibilità, computabilità, 
Boringhieri, Torino 1975. 


16 II decimo problema di Hilbert 

Autori 

MARTIN DAVIS e REUBEN HERSH per la biografia si 
rimanda all’articolo precedente. 

Bibliografia 

DAVIS MARTIN, Computability & Unsolvability, McGraw- 
Hill Book Company, 1958. 

wang hao. Giochi, logica e calcolatori, in questo volume 
a pagina 130. 

reid constance, Hilbert, Springer-Verlag, 1970. 

DAVIS MARTIN, Hilbert's Tenth Problem is Unsolvable in 
«American Mathematical Monthly », 80, n. 3, 1973. 


17 Gli algoritmi 

Autore 

DONALD E. KNUTH insegna scienza dei calcolatori al¬ 
la Stanford University. Diplomatosi in matematica al Case 
Institute of Technology si è laureato in matematica al Ca¬ 
lifornia Institute of Technology nel 1963, dove è rimasto 
per cinque anni dopo la laurea diventando professore di ma¬ 
tematica. Nel 1968 è entrato a far parte del Dipartimento 
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di scienza dei calcolatori di Stanford. Knuth ha ricevuto 
diversi riconoscimenti per le sue ricerche, compreso lo A.M. 
Turing Award dell’Association for Computing Machinery 
nel 1974. Il Turing Award faceva menzione della serie di 
sette volumi che sta scrivendo intitolata The art of Com¬ 
puter Programming, di cui conta di completare i primi 
cinque entro il 1980. 


Bibliografia 

knuth donald e., Ancient Babylonian Algorithms in 
«Communications of thè ACM», 15, n. 7, luglio 1972. 

KNUTH DONALD e., The Art of Computer Programming: 
Vols. l-lll, Addison-Wesley Publishing Company 1973. 

knuth donald e.. Computer Science and Its Relation to 
Mathematics in «The American Mathematical Monthly», 
81, n. 4, aprile 1974. 

amble o. e knuth d.eT, Ordered Hash Tables in «The 
Computer Journal », 17, maggio 1974- 
nievergelt l, Binary Search Trees and File Organization 
in «Computing Surveys», 6, n. 3, settembre 1974. 

yao andrew c. e yao frances F., The Complexity of 
Searching an Ordered Random Table in «Symposium on 
Foundations of Computer Science », IEEE Computer Socie- 
ty’s Technical Committee, IEEE Computer Society, 1976. 


18 La teoria delle catastrofi 

Autore 

E.C. ZEEMAN insegna matematica all’Università di 
Warwick dove ha fondato e dirige il Mathematics Research 
Centre. Zeeman ha iniziato i suoi studi di matematica su¬ 


periore nel 1947, dopo quattro anni di servizio come ufficia¬ 
le d’aviazione nella Royal Air Force. Dopo essersi diploma¬ 
to nel 1948 e laurato nel 1954 all’Università di Cambridge, 
ha insegnato in questa università per 10 anni prima di pas¬ 
sare a Warwick nel 1964. Fino al 1970 i suoi interessi era¬ 
no soprattutto per la topologia e in questo campo ha pro¬ 
dotto una cinquantina di articoli. Nel frattempo, intorno al 
1960, ha scritto tre articoli sul cervello che, stando alle 
sue parole, non erano nulla di eccezionale ma hanno avu¬ 
to il merito di indirizzare verso la biologia gli interessi di 
René Thom, contribuendo quindi in modo indiretto all’ela¬ 
borazione da parte di quest’ultimo della teoria delle cata¬ 
strofi. Negli ultimi cinque anni gli interessi di Zeeman sono 
stati concentrati soprattutto sullo sviluppo della parte ma¬ 
tematica della teoria delle catastrofi e sulle applicazioni di 
tale teoria a diversi settori della scienza. 


Bibliografia 

zeeman E.C., Primary and Secondary Waves in Develop- 
ment Biology in « Lectures on Mathematics in thè Life 
Sciences », 7: Some Mathematical Questions in Biology, a 
cura di Simon A. Levin, American Mathematical Society, 
1974. 

thom r. e zeeman e.c., Catastrophe Theory; Its Present 
State and Future Perspectives in « Dynamical Systems- 
-Warwich 1974: Proceedings of a Symposium Held at thè 
University of Warwich 1973/74 » a cura di Anthony Man- 
ning, Springer-Verlag ,1975. 

thom rene, Structurai Stability and Morphogenesis, W.A. 
Benjamin, Ine., 1975. 

trotman d.j.a. e zeeman e.c., The Classification of Ele- 
mentary Catastrophes of Codimension 5 in « Symposium 
on Catastrophe Theory; Seattle 1976» Springer-Verlag (in 
stampa). 
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Gli articoli presentati in questo volu¬ 
me, alcuni dei quali inediti in Italia, 
offrono una panoramica dello stato 
della ricerca contemporanea in ma¬ 
tematica, sia per quanto riguarda gli 
studi fondazionali dalla portata più 
nettamente filosofica, sia per quanto 
riguarda il lato applicativo, legato 
alla soluzione di problemi concreti. 
Caratteristica di questi articoli è il 
fatto che gli autori in gran parte 
coincidono con i matematici e i filo¬ 
sofi che hanno dato contributi fon¬ 
damentali alla ricerca in questo se¬ 
colo; basti pensare a Quine, a Tarski 
e a Cohen. Nella prima parte del vo¬ 
lume è possibile trovare una chiara — 
esposizione del problema dei fonda¬ 
menti, e a questo riguardo sono ac¬ 
costati articoli su argomenti specifi¬ 
ci, come l’indipendenza dell’ipotesi 
del continuo o l’analisi non-standard, 
ad articoli di carattere più generale 
sull’importanza fondazionale della 
teoria degli insiemi e sui fondamenti 
dell’analisi. Nella seconda parte è 
l’aspetto logico matematico che pren¬ 
de il sopravvento. Il lettore è intro¬ 
dotto ai risultati fondamentali riguar¬ 
danti la decidibilità e la completezza 
delle teorie e agli strumenti essen¬ 
ziali per poter comprendere, alme¬ 
no nelle linee generali, i procedimen¬ 
ti con cui tali risultati sono stati ot¬ 
tenuti, primo fra tutti il concetto di 
algoritmo o di procedura effettiva, 
codificato nelle macchine di Turing, 
argomento con cui si apre la terza 
parte del volume. A questo punto il 
problema dei fondamenti della mate¬ 
matica viene espresso in una delle 
sue formulazioni più mature, come 
ricerca di una adeguatezza tra se¬ 
mantica, ossia teoria degli insiemi, 
e sintassi, ossia teorie formali, di 
una corrispondenza fra verità e di¬ 
mostrazione. Il fatto che tale corri¬ 
spondenza sia solo parziale (è que¬ 
sta una delle conseguenze del fa¬ 
moso teorema di Godei) costituisce 
uno dei risultati più interessanti tra 
quelli conseguiti dalla ricerca nel 
campo della logica matematica: 
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